← Back to Skills Marketplace

Deepsop Genvis 助手

Name: Deepsop Genvis 助手
Author: kukuoai

by kukuoAI · GitHub ↗ · v1.0.0 · MIT-0

cross-platform ⚠ suspicious

Downloads

Stars

Active Installs

Versions

Install in OpenClaw

/install deepsop-genvis-ai

Description

AI 图片与视频异步生成技能，调用 AI Artist API 根据文本提示词生成图片或视频，自动轮询直到任务完成。 ⚠️ 使用前必须设置环境变量 AI_ARTIST_TOKEN 为你自己的 API Key！需要 API Key 授权：已有账号请前往 https://ai.deepsop.com/login?s...

README (SKILL.md)

\r \r

AI Image Generator\r

\r 异步生成 AI 图片与视频的技能。\r \r

⚠️ 首次使用必读\r

1. 获取 API Key\r

\r 本技能需要 API Key 授权才能调用 AI Artist API：\r \r

已有账号 → 前往 https://ai.deepsop.com/login?source=2 登录获取\r
没有账号 → 前往 https://ai.deepsop.com/register?source=2 注册后获取\r \r 登录后在复制您的 API Key（sk- 开头）。\r \r

2. 设置环境变量\r

\r 在使用前，你必须先设置自己的 API Key：\r \r

# Linux/macOS/Git Bash (Windows)\r
export AI_ARTIST_TOKEN="sk-your_api_key_here"\r
\r
# Windows PowerShell\r
$env:AI_ARTIST_TOKEN="sk-your_api_key_here"\r
```\r
\r
或在项目根目录放一个 `.env` 文件（需 `pip install python-dotenv`，脚本会自动加载）：\r
\r
```ini\r
AI_ARTIST_TOKEN=sk-your_api_key_here\r
FEISHU_WEBHOOK_URL=  # 可选，用于结果通知\r
```\r
\r
### 3. 验证配置\r
\r
**验证配置是否正确：**\r
\r
```bash\r
python3 scripts/test_config.py\r
```\r
\r
详细配置说明请查看下方"环境配置"章节。\r
\r
## 快速开始\r
\r
```bash\r
python3 scripts/generate_image.py "提示词"\r
```\r
\r
## 意图澄清指南（重要）\r
\r
**调用前必须做的事**：当用户的请求涉及参数复杂的模型，或关键信息缺失时，**先向用户提问确认意图**，再执行生成，避免浪费配额生成不符合预期的作品。\r
\r
### 通用判断流程\r
\r
1. **先分辨媒介**：图片 vs 视频（关键词："画/生成图片/海报/插画" → 图片；"视频/动画/片段/动起来" → 视频）。\r
2. **判断输入材料**：\r
   - 纯文字 → 文生模式（TEXT）\r
   - 有一张首帧图 → 首帧图生视频（FIRST&LAST）\r
   - 有首尾两张图 → 首尾帧控制（FIRST&LAST，需首帧+尾帧）\r
   - 有参考视频 → 续写（CONTINUATION）、编辑（EDIT）、参考生成（FEATURE/REFERENCE）\r
   - 有多张参考图（要求角色/元素一致性） → 参考图模式（REFERENCE）\r
3. **若用户意图不明确或关键材料缺失，必须提问**，不要擅自假设。\r
\r
### 按模型列出"必须澄清的关键点"\r
\r
**所有视频模型通用**：\r
- 时长（秒）？ 比例？（16:9 横屏 / 9:16 竖屏 / 1:1 正方）\r
- 是否需要生成声音 / 配音 / 音乐？\r
- 提示词含有人物时，是否希望保持角色一致性？\r
\r
**`klingV3Omni`（最复杂）**：5 种生成类型 + 多镜头模式，务必确认：\r
- **生成类型**：文生（TEXT）/ 首尾帧（FIRST&LAST）/ 参考图生视频（REFERENCE）/ 编辑已有视频（EDIT）/ 参考视频再创作（FEATURE）？\r
- **镜头模式**：单镜头（single）/ 智能多镜头（multi）/ 自定义分镜（customize，需要用户给出每个分镜的描述 + 时长）？\r
- **生成模式**：`std` 标准 / `pro` 专家级？\r
- 若是 EDIT/FEATURE：需要参考视频 URL，并确认"是否保留原音"（`keep_original_sound` yes/no）\r
\r
**`W2.6r` / `W2.7r`（参考视频模式）**：\r
- 参考图片 + 参考视频的总数 ≤ 5，询问用户是否都准备好了 URL / 本地文件\r
- 是否想保留原视频的角色音色？\r
- 希望迁移到什么场景？迁移的主体是什么？（让用户把场景描述写进 prompt）\r
\r
**`W2.7i`（图生视频，支持续写）**：\r
- 输入是"一张首帧图"要让它动起来？→ FIRST&LAST（可选提供尾帧，让首尾过渡更可控）\r
- 输入是"一段已有视频"要让它继续播？→ CONTINUATION（需要 `first_clip_url`）\r
- 动作/运镜希望如何展开？请用户描述（写进 prompt）\r
\r
**`W2.6t` / `W2.7t`（文生视频）**：\r
- 是否需要多镜头叙事？若是 → `shot_type="multi"`（智能分镜）\r
- 是否有反向提示词（不希望出现的内容）？\r
- 是否需要智能改写提示词（`prompt_extend=True`，默认 false）？\r
- 是否需要传入自定义音频？\r
\r
**`V3.1Fast`（V3.1 系列的复杂款）**：\r
- 是否需要翻译为英文提示词（`enhance_prompt`）？\r
- 是否允许生成人物（`personGeneration=allow_adult/dont_allow`）？\r
- 图像缩放模式（`resize_mode=pad/crop`）？\r
- 时长 4 秒还是 8 秒？\r
\r
**`V3.1FB` / `V3.1PB`**：时长固定 8 秒，不必问；但要确认比例 / 分辨率。\r
\r
**`S1.5Pro`（影视级）**：\r
- 是否追求"音画同步 + 口型对齐"？（说明场景是否包含对话）\r
- 时长在 4-12 秒之间，默认 10 秒，可问用户。\r
\r
**图片复杂款 `W2.7` / `W2.7Pro` / `N2` / `3.1Nano2-Evo`**：\r
- 有无参考图？做"风格迁移"、"角色一致性"、"文字渲染"时参考图能显著提升质量。\r
- 是否需要特定比例？（默认 1:1，横图/竖图需指定）\r
- 质量档位（1K/2K/4K，详见每个模型表）\r
\r
**`Image2`（GPTimage-2，OpenAI gpt-image-2 接入）**：\r
- 渲染质量预设？`low`（最快）/ `medium`（平衡，默认）/ `high`（质量）——用 `--ratiocination`\r
- 一次出几张？1–10，用 `--n`\r
- 是否需要参考图？支持最多 16 张参考图、单张 ≤50MB；提示词上限 16000 字\r
- 默认尺寸 `auto`（智能比例），可改为 `1:1 / 3:4 / 4:3 / 16:9 / 9:16` 等（**禁用** `1:4 / 4:1 / 1:8 / 8:1`）\r
- 该模型 **不接受 `webSearch`、不接受 `imageSearch`**；仅 `3.1Nano2-Evo` 支持 `imageSearch`\r
\r
### 提问姿态（给 Claude 的指令）\r
\r
- **一次最多问 2-3 个最关键的问题**，别堆 10 个选项让用户懵。\r
- **优先问对画面/成本影响最大的参数**（生成类型 > 时长 > 分辨率 > 次要参数）。\r
- **提供默认建议**，让用户说"就这样"也能继续，不要强制用户全部自选。\r
  示例："我打算用 `klingV3Omni` 做参考图生视频，比例 16:9、时长 10s、生成声音。你有几张想作为参考的图片吗？要不要保留原音？"\r
- **材料缺失时必须停下来要素材**（URL / 本地文件路径），不要用占位符或假 URL 代替。\r
- 用户若说"随便/都行"，按默认值直接执行，并在生成后告知用了哪些默认。\r
\r
### 何时可以不提问直接执行\r
\r
- 用户请求非常明确（提示词清晰 + 指定了模型 + 提供了必要的参考材料 URL）\r
- 用户明确说"快速来一张就行" / "随便出个视频"：用默认模型与默认参数，生成后告知用了什么。\r
- 用户只要一张插画/头像/风景图 → 直接用默认 `3.1Nano2-Evo` 图片模型。\r
\r
## 参考图/视频上传流程\r
\r
当用户提供本地文件作为参考图或参考视频时，需要先调用文件上传 API 转换为可访问的 URL：\r
\r
### 文件上传 API\r
\r
```bash\r
curl --location --request POST 'https://ai.deepsop.com/prod-api/system/fileUpload/upload' \\r
--header 'x-api-key: sk-your_api_key_here' \\r
--form 'file=@"C:\\Users\\admin\\Downloads\\image.png"'\r
```\r
\r
**返回结果：**\r
```json\r
{\r
  "msg": "操作成功",\r
  "fileName": "image.png",\r
  "code": 200,\r
  "url": "https://kocgo-ai-sales-test.oss-cn-hangzhou.aliyuncs.com/material/100/xxx.png"\r
}\r
```\r
\r
### 使用上传后的 URL\r
\r
获取到 `url` 后，可作为 `firstImageUrl`、`lastImageUrl` 或其他图片参数传入生成接口。\r
\r
## 在对话中直接返回图片\r
\r
### 方式 1: Markdown 图片语法（推荐）\r
\r
生成图片后，直接在回复中使用 Markdown 语法：\r
\r
```markdown\r
![描述](图片URL)\r
```\r
\r
**平台支持情况：**\r
- ✅ WebChat、Discord、Telegram：完全支持\r
- ✅ 飞书：支持（需公开 URL）\r
- ❌ WhatsApp：不支持\r
\r
### 方式 2: 下载后发送（需要 message 工具）\r
\r
使用 `--download` 参数下载图片，然后通过 message 工具发送：\r
\r
```bash\r
python3 scripts/generate_image.py "风景画" --download\r
```\r
\r
然后在代码中读取图片并发送：\r
\r
```python\r
from scripts.generate_image import generate_image\r
import base64\r
\r
result = generate_image(prompt="风景画", download=True)\r
\r
if result and result["status"] == "SUCCESS":\r
    # 方式 A: 使用 data URI\r
    image_uri = result["data_uri"]  # data:image/png;base64,...\r
    \r
    # 方式 B: 读取本地文件\r
    with open(result["local_path"], "rb") as f:\r
        image_data = f.read()\r
        base64_data = base64.b64encode(image_data).decode()\r
```\r
\r
## 参数说明\r
\r
### 通用参数\r
\r
| 参数 | 默认值 | 说明 |\r
|------|--------|------|\r
| `prompt` | 必填 | 生成提示词（图片或视频描述）|\r
| `--model` | 自动推断 | 生成模型。**支持双入口**：友好别名（如 `HappyHorse`）或 `methodType` 字符串（如 `19`）。未指定时根据 prompt 关键词自动推断：包含 `视频/动画/短片/动起来/镜头/clip/motion/video` 等 → `V3.1FB`；其余 → `3.1Nano2-Evo`。图片：`3.1Nano2-Evo`、`S5.0L`、`N2`、`W2.7`、`W2.7Pro`、`Nano2-Beta-Evo`、`Image2`；视频：`V3.1FB`、`S1.5Pro`、`V3.1PB`、`V3.1Fast`、`W2.6t/i/r`、`klingV3Omni`、`W2.7t/i/r`、`S2.0`、`S2.0Fast`、`HappyHorse` |\r
| `--list-models` | - | 列出当前服务端激活的模型（hiddenState=0）后退出，不需 prompt |\r
| `--dry-run` | - | 仅构建并打印最终 payload，不提交任务（调试用）|\r
| `--json-output` | - | 以单行 JSON 向 **stdout** 输出最终结果 `{status,url,message,local_path?}`，便于 openclaw 等编排器解析 |\r
| `--interval` | `5` | 轮询间隔(秒) |\r
| `--max-wait` | 图片 600 / 视频 1200 | 任务轮询最长等待秒数 |\r
\r
#### 输出契约（给编排器/openclaw）\r
\r
- **stdout**：任务完成后**恰好一行**最终结果\r
  - 默认：成功时输出 `URL`，失败时留空\r
  - `--json-output`：始终输出一行 JSON，形如 `{"status":"SUCCESS","url":"https://...","message":"..."}`\r
  - `--markdown-output`：成功时输出 `![prompt](url)`\r
- **stderr**：所有人类可读进度日志（`[auto]`、`[upload]`、预估费用、任务 ID、轮询状态变化、`⚠️` 警告、错误说明）\r
- **退出码**：`0` = 成功，`1` = 失败/超时\r
\r
脚本会**始终轮询到终态（SUCCESS / FAILED / TIMEOUT）才退出**，无需调用方自己再查询结果。\r
\r
### 图片专属参数\r
\r
| 参数 | 默认值 | 说明 |\r
|------|--------|------|\r
| `--quality` | `2K` | 图片质量 (2K/4K) |\r
| `--size` | 模型默认值 | 图片尺寸。`S5.0L` / `W2.7` / `W2.7Pro`: `2048x2048`，`N2` / `3.1Nano2-Evo` / `Nano2-Beta-Evo`: `1:1` |\r
| `--download` | - | 下载图片到本地 |\r
| `--output-dir` | `workspace/images` | 图片保存目录 |\r
| `--markdown-output` | - | 以 Markdown 格式输出图片链接 |\r
| `--reference-image` | - | 参考图本地路径，自动上传后作为 image-to-image 参考 |\r
| `--reference-image-url` | - | 已上传的参考图 URL（跳过上传流程）|\r
| `--web-search` / `--no-web-search` | - | 启用/关闭联网搜索（仅 `S5.0L`、`3.1Nano2-Evo`）|\r
| `--image-search` / `--no-image-search` | - | 启用/关闭图像搜索（仅 `3.1Nano2-Evo`）|\r
| `--ratiocination` | `medium` | 渲染质量预设（仅 `Image2`）：`low` / `medium` / `high` |\r
| `--n` | `1` | 生成数量（图片 `Image2` 1–10；视频 `V3.1Fast` 1–4）|\r
\r
### 视频专属参数\r
\r
| 参数 | 默认值 | 说明 |\r
|------|--------|------|\r
| `--ratio` | `16:9` | 画面比例，如 `16:9`、`9:16`、`1:1` |\r
| `--resolution` | `720p` | 视频分辨率，如 `720p`、`1080p` |\r
| `--duration` | `10` | 视频时长（秒）|\r
| `--first-image-url` | - | 首帧参考图 URL |\r
| `--last-image-url` | - | 尾帧参考图 URL |\r
| `--first-image` | - | 首帧参考图本地路径，自动上传后转换为 URL |\r
| `--last-image` | - | 尾帧参考图本地路径，自动上传后转换为 URL |\r
| `--generate-audio` | - | 开启音频生成（按模型能力生效） |\r
| `--no-audio` | - | 关闭音频生成（按模型能力生效） |\r
\r
## 模型来源与单一真相源\r
\r
脚本以 **服务端 `consumeSource/list` 接口** 为模型存在性 / `hiddenState` / 命名的唯一真相源，本地仅维护与前端一致的硬编码约束（比例 / 分辨率 / 时长 / 生成类型 / 字段可见性等），无法从接口推导。\r
\r
- **运行时校验**：每次提交任务前自动调用 `consumeSource/list`，若该模型 `hiddenState=1` 或不存在则直接拒绝\r
- **`--list-models`**：从接口拉取激活模型并附带「漂移检测」（drift），若服务端激活了脚本未注册的模型 / 本地模型已下线，会以 `[drift] ...` 形式打印到 stderr\r
- **CLI 双入口**：`--model HappyHorse` 与 `--model 19` 等价，前者是友好别名，后者是 `sourceValue`/`methodType`；脚本通过 `_resolve_model_key` 自动归一化\r
\r
## 支持的模型\r
\r
### 图片模型\r
\r
| 模型 | sourceName | methodType | 默认尺寸 | 特点 |\r
|------|-----------|-----------|---------|------|\r
| `S5.0L` | DeepSop·S5.0L | `4` | `2048x2048` | 默认模型，质量 2K/3K，支持联网，像素尺寸 WxH |\r
| `N2` | DeepSop·Nano1 Pro | `2` | `1:1` | 多模态输入，精细参数调节，卓越文字渲染与角色一致性（比例格式；服务端已重命名为 Nano1 Pro）|\r
| `W2.7` | DeepSop.W2.7 | `6` | `2048*2048` | 文生图/图生图多模态输入，质量 1K/2K，size 用 `*` 分隔 |\r
| `W2.7Pro` | DeepSop.W2.7Pro | `7` | `2048*2048` | 精准控图与风格迁移，质量 1K/2K，size 用 `*` 分隔 |\r
| `3.1Nano2-Evo` | DeepSop·Nano2 | `8` | `1:1` | N2 Evo 版（服务端称 Nano2），支持 `imageSearch` 与 `webSearch` |\r
| `Nano2-Beta-Evo` | DeepSop·Nano2 Beta-Evo | `9` | `1:1` | N2 Beta Evo 版，多模态输入、文字渲染与角色一致性 |\r
| `Image2` | DeepSop·Image2 | `10` | `auto` | **GPTimage-2** 接入；支持 `ratiocination`(low/medium/high)、`n`(1–10)；提示词 16000 字；参考图 ≤50MB×16 张；禁用 1:4/4:1/1:8/8:1 |\r
\r
### 视频模型\r
\r
| 模型 | sourceName | methodType | 默认比例 | 默认分辨率 | 默认时长 | 特点 |\r
|------|-----------|-----------|---------|-----------|---------|------|\r
| `S1.5Pro` | DeepSop·S1.5Pro | `2` | `16:9` | `720p` | 10s | 影视级连贯叙事，音画同步与精准口型对齐 |\r
| `V3.1FB` | DeepSop·V3.1FB | `3` | `16:9` | `1080p` | 8s | 快速生成，**时长固定 8 秒** |\r
| `V3.1PB` | DeepSop·V3.1PB | `4` | `adaptive` | `720p` | 8s | V3.1Pro 多图参考，**时长固定 8 秒** |\r
| `V3.1Fast` | DeepSop·V3.1Fast | `5` | `16:9` | `720p` | 8s | 快速生成，音画同步，时长 4s/8s |\r
| `W2.6t` | DeepSop·W2.6t | `7` | `16:9` | `720p` | 10s | 文生视频，3-15s，size 用 `*` 像素，15s 1080P |\r
| `W2.6i` | DeepSop·W2.6i | `8` | `16:9` | `720p` | 10s | 图生视频，3-15s，size 用 ratio，无尾帧支持 |\r
| `W2.6r` | DeepSop·W2.6r | `9` | `16:9` | `720p` | 10s | 参考视频，**3-10s**，size 用 `*` 像素 |\r
| `klingV3Omni` | DeepSop.klingV3Omni | `10` | `16:9` | `720p` | 10s | 多模态融合，**3-15s**，按张计费，支持分镜 |\r
| `W2.7i` | DeepSop·W2.7i | `14` | `16:9` | `720p` | 10s | 图生视频，首尾帧平滑过渡，动作延展与视频续写 |\r
| `W2.7t` | DeepSop.W2.7t | `15` | `16:9` | `720p` | 10s | 文生视频，智能多镜头剪辑，自动配音，2K 高清 |\r
| `W2.7r` | DeepSop.W2.7r | `16` | `16:9` | `720p` | 10s | 参考视频生成，保留角色音色，多模态融合编辑 |\r
| `S2.0` | DeepSop·S2.0 | `17` | `16:9` | `720p` | 10s | Seedance2.0，4-15s，支持多音频参考（`audioUrlList`）+ 联网搜索（`webSearch`），分辨率 480p/720p/1080p |\r
| `S2.0Fast` | DeepSop·S2.0Fast | `18` | `16:9` | `720p` | 10s | Seedance2.0 Fast 快速版，4-15s，多音频参考 + 联网搜索，最高 720p |\r
| `HappyHorse` | DeepSop.HappyHorse | `19` | `16:9` | `720p` | 10s | 高效短视频，3-15s，支持 TEXT/FIRST&LAST/REFERENCE/EDIT，独有 `audioSetting`（auto/origin），EDIT 模式需 `firstClipUrl` |\r
\r
**V3.1 系列时长（来自前端 `matchVideoDurationInfo`）：**\r
- `V3.1FB` / `V3.1PB`：**时长固定为 8 秒**\r
- `V3.1Fast`：4 秒 或 8 秒\r
- 分辨率可选：720p / 1080p / 4K；比例 16:9 / 9:16 / adaptive\r
\r
**WAN2.6 / WAN2.7 / klingV3Omni 系列：**\r
- `*t`：纯文生视频  ·  `*i`：首帧图生视频  ·  `*r`：参考图/视频生成\r
- 时长范围：`W2.6r` 为 **3-10s**；其余（包含 `klingV3Omni`）为 **3-15s**\r
- `size` 序列化规则：**仅 `W2.6t` / `W2.6r`** 使用 `宽*高` 像素格式；`W2.6i` / `W2.7t/i/r` / `klingV3Omni` 的 `size` 为比例字符串（如 `16:9`）\r
- 分辨率可选：720p / 1080p（`klingV3Omni` 无分辨率选项）\r
- 比例：`W2.6t` / `W2.6r` / `W2.7t` / `W2.7r` 支持 1:1 / 3:4 / 4:3 / 16:9 / 9:16；`W2.6i` / `W2.7i` 不可选比例（由首帧决定）；`klingV3Omni` 仅 1:1 / 16:9 / 9:16\r
- `W2.6i` / Sora2 系列不支持尾帧图片（仅 `W2.7i` 支持）\r
- `W2.6t` / `W2.6i` / `W2.7*` 支持传入自定义音频（`audioUrl`）\r
\r
**Seedance2.0 系列（`S2.0` / `S2.0Fast`）：**\r
- 生成类型：`TEXT` / `FIRST&LAST` / `REFERENCE`\r
- 时长：**4-15 秒**，默认 10s，支持智能时长（`durationSwitch=2`）\r
- 比例：`adaptive` / `1:1` / `3:4` / `4:3` / `16:9` / `9:16` / `21:9`，`size` 直接提交比例字符串\r
- 分辨率：`S2.0` 支持 480p / 720p / 1080p；`S2.0Fast` 仅 480p / 720p\r
- 独有参数：\r
  - `audioUrlList`：多音频参考（至多 3 个，时长 2-15s，总时长 ≤ 15s）\r
  - `videoUrlList`：参考视频（至多 3 个，时长 2-15s，总时长 ≤ 15s）\r
  - `webSearch`：是否启用联网搜索\r
  - `generateAudio`：是否生成音频（默认开启）\r
- 校验：当传入 `audioUrlList` 时，必须至少提供一张参考图或一个参考视频\r
\r
**HappyHorse（`HappyHorse`，methodType=19）：**\r
- 生成类型：`TEXT` / `FIRST&LAST` / `REFERENCE` / `EDIT`\r
- 时长：**3-15 秒**，默认 10s（EDIT 模式时长由编辑视频决定，前端隐藏滑块）\r
- 比例：`1:1` / `3:4` / `4:3` / `5:4` / `4:5` / `16:9` / `9:16` / `21:9` / `9:21`（EDIT 模式无 ratio）\r
- 分辨率：`720p` / `1080p`\r
- **不支持** 尾帧图片（`lastImageUrl`）、`negativePrompt`、`generateAudio`、`enhancePrompt`、`promptExtend`、`shotType`、`webSearch`\r
- 独有参数：\r
  - `firstClipUrl`：编辑视频 URL（EDIT 模式**必填**）\r
  - `audioSetting`：声音控制，`auto`（由模型控制，默认）/ `origin`（保留视频原声），仅 EDIT 模式可见\r
- EDIT 模式下 `imageUrlList` 至多 5 张参考图\r
- 校验：EDIT 模式必须上传 `firstClipUrl`\r
\r
## 使用示例\r
\r
```bash\r
# 查看当前服务端激活的模型\r
python3 scripts/generate_image.py --list-models\r
\r
# 基础用法 - 默认图片模型 3.1Nano2-Evo\r
python3 scripts/generate_image.py "一匹狼"\r
\r
# 使用 N2 模型（比例尺寸）\r
python3 scripts/generate_image.py "生成一只狗" --model N2 --size "16:9"\r
\r
# W2.7 图片模型\r
python3 scripts/generate_image.py "复古海报" --model W2.7 --quality "4K"\r
\r
# W2.7Pro 精准控图\r
python3 scripts/generate_image.py "角色三视图" --model W2.7Pro\r
\r
# 3.1Nano2-Evo / Nano2-Beta-Evo（N2 进化版）\r
python3 scripts/generate_image.py "赛博朋克街景" --model 3.1Nano2-Evo --size "16:9"\r
python3 scripts/generate_image.py "少女肖像" --model Nano2-Beta-Evo --size "3:4"\r
\r
# Image2（GPTimage-2）—— 默认 auto 比例，medium 渲染质量\r
python3 scripts/generate_image.py "一只可爱的柯基犬坐在草地上" --model Image2\r
# Image2 出 4 张高质量图片\r
python3 scripts/generate_image.py "产品宣传图 4 种风格" --model Image2 --n 4 --ratiocination high --size "1:1"\r
# 3.1Nano2-Evo 启用图像搜索 + 联网搜索\r
python3 scripts/generate_image.py "帮我画一种雨季仅出现三天的菌菇" --model 3.1Nano2-Evo --image-search --web-search\r
\r
# 下载图片\r
python3 scripts/generate_image.py "风景画" --download\r
\r
# 高质量生成（S5.0L）\r
python3 scripts/generate_image.py "风景画" --quality "4K" --size "4096x4096"\r
\r
# 直接输出 Markdown 图片链接\r
python3 scripts/generate_image.py "一只可爱的猫" --markdown-output\r
\r
# 使用参考图生成（自动上传本地图片并转换为 URL）\r
python3 scripts/generate_image.py "基于这张图生成变体" --reference-image "./reference.png"\r
\r
# 生成视频 - 默认 V3.1FB（快速、固定 8 秒）\r
python3 scripts/generate_image.py "现代轻奢吊灯" --model V3.1FB\r
\r
# 生成视频 - S1.5Pro（默认 16:9 / 720p / 10s）\r
python3 scripts/generate_image.py "小骏马祝福大家新年快乐" --model S1.5Pro\r
\r
# 生成视频 - 指定比例和分辨率\r
python3 scripts/generate_image.py "海边日落风景" --model S1.5Pro --ratio "9:16" --resolution "1080p"\r
\r
# V3.1FB - 快速基础（8 秒）\r
python3 scripts/generate_image.py "现代轻奢吊灯" --model V3.1FB --ratio "16:9" --resolution "1080p" --duration 8\r
\r
# V3.1PB - 自适应比例（8 秒）\r
python3 scripts/generate_image.py "水晶灯特写" --model V3.1PB --ratio "adaptive" --resolution "720p" --duration 8\r
\r
# V3.1Fast - 首帧图生视频（4 秒）\r
python3 scripts/generate_image.py "灯具展示" --model V3.1Fast --first-image "./lamp.jpg" --duration 4\r
\r
# klingV3Omni - 多模态融合（按张计费）\r
python3 scripts/generate_image.py "多模态融合镜头" --model klingV3Omni --ratio "16:9" --duration 8\r
\r
# W2.6t / W2.7t - 文生视频（10 秒）\r
python3 scripts/generate_image.py "现代轻奢吊灯宣传" --model W2.6t --ratio "16:9" --resolution "1080p" --duration 10\r
python3 scripts/generate_image.py "品牌短片自动配音 2K" --model W2.7t --ratio "16:9" --resolution "1080p" --duration 10\r
\r
# W2.6i / W2.7i - 首帧图生视频（8 秒）\r
python3 scripts/generate_image.py "水晶灯展示" --model W2.6i --first-image "./lamp.jpg" --ratio "9:16" --resolution "720p" --duration 8\r
python3 scripts/generate_image.py "角色动作延展" --model W2.7i --first-image "./char.jpg" --last-image "./char_end.jpg" --duration 8\r
\r
# S2.0 / S2.0Fast - Seedance2.0 文生视频\r
python3 scripts/generate_image.py "海浪拍打礁石" --model S2.0 --ratio "16:9" --resolution "1080p" --duration 10\r
python3 scripts/generate_image.py "城市夜景延时" --model S2.0Fast --ratio "9:16" --resolution "720p" --duration 6 --web-search\r
# S2.0 多音频参考（自动上传本地音频）\r
python3 scripts/generate_image.py "猫咪互动" --model S2.0 --first-image "./cat.jpg" --audio-path-list "./bg.mp3,./voice.wav"\r
\r
# HappyHorse - 文生短视频（社交/广告场景）\r
python3 scripts/generate_image.py "咖啡店开业宣传短片" --model HappyHorse --ratio "9:16" --resolution "1080p" --duration 8\r
# HappyHorse - 首帧图生视频\r
python3 scripts/generate_image.py "产品旋转展示" --model HappyHorse --first-image "./product.jpg" --generation-type "FIRST&LAST"\r
# HappyHorse - 视频编辑模式（保留原声）\r
python3 scripts/generate_image.py "把背景换成海边" --model HappyHorse --generation-type EDIT --first-clip-url "https://.../source.mp4" --audio-setting origin\r
\r
# W2.6r / W2.7r - 参考视频生成（CLI 需传已上传 URL，或使用程序化调用）\r
python3 scripts/generate_image.py "参考素材风格生成" --model W2.6r --ratio "16:9" --resolution "720p" --duration 10\r
python3 scripts/generate_image.py "保留角色音色迁移场景" --model W2.7r --ratio "16:9" --resolution "720p" --duration 10\r
```\r
\r
## 程序化调用\r
\r
```python\r
from scripts.generate_image import generate_image, generate_video\r
\r
# 图片 - 默认 3.1Nano2-Evo\r
result = generate_image(prompt="一只可爱的猫咪")\r
\r
# 查询当前激活模型（预览用）\r
from scripts.generate_image import list_active_models\r
print(list_active_models())\r
\r
# 图片 - N2（比例尺寸）\r
result = generate_image(prompt="生成一只狗", model="N2", size="16:9")\r
\r
# 图片 - W2.7Pro 精准控图\r
result = generate_image(prompt="角色三视图", model="W2.7Pro", quality="4K")\r
\r
# 图片 - 下载到本地\r
result = generate_image(prompt="风景画", model="S5.0L", download=True, output_dir="./images")\r
\r
# V3.1FB - 文生视频\r
result = generate_video(\r
    prompt="现代轻奢吊灯",\r
    model="V3.1FB",\r
    ratio="16:9",\r
    resolution="1080p",\r
    duration=8\r
)\r
\r
# V3.1Fast - 首帧图生视频\r
result = generate_video(\r
    prompt="灯具展示",\r
    model="V3.1Fast",\r
    first_image_url="https://example.com/lamp.jpg",\r
    ratio="9:16",\r
    resolution="1080p",\r
    duration=8\r
)\r
\r
# V3.1PB - 首尾帧控制\r
result = generate_video(\r
    prompt="灯具变形动画",\r
    model="V3.1PB",\r
    first_image_url="https://example.com/start.jpg",\r
    last_image_url="https://example.com/end.jpg",\r
    ratio="16:9",\r
    resolution="1080p",\r
    duration=8\r
)\r
\r
# W2.7r - 参考视频生成（多模态融合）\r
result = generate_video(\r
    prompt="保留角色音色迁移到新场景",\r
    model="W2.7r",\r
    image_url_list=["https://example.com/ref1.jpg", "https://example.com/ref2.jpg"],\r
    video_url_list=["https://example.com/ref.mp4"],\r
    ratio="16:9",\r
    resolution="720p",\r
    duration=10\r
)\r
\r
# S2.0 - Seedance2.0 多模态融合（图像 + 多音频参考 + 联网搜索）\r
result = generate_video(\r
    prompt="海浪拍打礁石，海鸥飞过",\r
    model="S2.0",\r
    first_image_url="https://example.com/sea.jpg",\r
    audio_url_list=[\r
        "https://example.com/wave.mp3",\r
        "https://example.com/seagull.mp3",\r
    ],\r
    web_search=True,\r
    ratio="16:9",\r
    resolution="1080p",\r
    duration=10,\r
)\r
\r
# klingV3Omni - 多模态融合（按张计费）\r
result = generate_video(\r
    prompt="镜头一致性多图融合",\r
    model="klingV3Omni",\r
    image_url_list=["https://example.com/scene1.jpg", "https://example.com/scene2.jpg"],\r
    ratio="16:9",\r
    duration=8\r
)\r
\r
if result and result["status"] == "SUCCESS":\r
    print(f"链接: {result['url']}")\r
\r
# 视频 - 默认 V3.1FB\r
result = generate_video(prompt="小骏马祝福大家新年快乐")\r
\r
# 视频 - 指定比例、分辨率、时长\r
result = generate_video(\r
    prompt="海边日落风景",\r
    model="S1.5Pro",\r
    ratio="9:16",\r
    resolution="1080p",\r
    duration=5\r
)\r
\r
if result and result["status"] == "SUCCESS":\r
    print(f"视频链接: {result['url']}")\r
```\r
\r
## 返回字段\r
\r
| 字段 | 说明 |\r
|------|------|\r
| `status` | SUCCESS / FAILED / TIMEOUT |\r
| `url` | 图片URL |\r
| `message` | 状态描述 |\r
| `local_path` | 本地保存路径（需 --download） |\r
| `data_uri` | Base64 Data URI（需 --download） |\r
| `image_data` | 原始图片字节（需 --download） |\r
\r
## 环境配置\r
\r
### 必需配置 - API Key\r
\r
**重要：使用前必须设置你自己的 API Key！**\r
\r
#### 获取 API Key\r
\r
本技能需要 **API Key 授权**：\r
\r
1. 访问入口：\r
   - **已有账号** → [https://ai.deepsop.com/login?source=2](https://ai.deepsop.com/login?source=2) 登录获取\r
   - **没有账号** → [https://ai.deepsop.com/register?source=2](https://ai.deepsop.com/register?source=2) 注册获取\r
2. 登录后在复制您的 API Key\r
3. 复制生成的 API Key（格式：`sk-xxxxxx...`）\r
\r
#### 方式 1：使用 .env 文件（推荐）\r
\r
1. 复制 `.env.example` 为 `.env`：\r
   ```bash\r
   cp .env.example .env\r
   ```\r
\r
2. 编辑 `.env` 文件，填入你的 API Key：\r
   ```bash\r
   AI_ARTIST_TOKEN=sk-your_api_key_here\r
   ```\r
\r
3. 在运行脚本前加载环境变量：\r
   ```bash\r
   # Linux/macOS/Git Bash\r
   source .env\r
\r
   # 或使用 export\r
   export $(cat .env | xargs)\r
   ```\r
\r
#### 方式 2：直接设置环境变量\r
\r
##### Linux / macOS / Git Bash (Windows)\r
\r
```bash\r
export AI_ARTIST_TOKEN="sk-your_api_key_here"\r
```\r
\r
为了永久生效，将上述命令添加到 `~/.bashrc` 或 `~/.zshrc` 文件中。\r
\r
##### Windows PowerShell\r
\r
```powershell\r
$env:AI_ARTIST_TOKEN="sk-your_api_key_here"\r
```\r
\r
永久设置（系统级）：\r
```powershell\r
[System.Environment]::SetEnvironmentVariable('AI_ARTIST_TOKEN', 'sk-your_api_key_here', 'User')\r
```\r
\r
##### Windows CMD\r
\r
```cmd\r
set AI_ARTIST_TOKEN=sk-your_api_key_here\r
```\r
\r
#### 验证配置\r
\r
运行以下命令验证 API Key 是否设置成功：\r
\r
```bash\r
# Linux/macOS/Git Bash\r
echo $AI_ARTIST_TOKEN\r
\r
# Windows PowerShell\r
echo $env:AI_ARTIST_TOKEN\r
\r
# Windows CMD\r
echo %AI_ARTIST_TOKEN%\r
```\r
\r
如果输出为空或显示默认值，说明环境变量未正确设置。\r
\r
#### 测试配置（推荐）\r
\r
运行配置测试脚本，验证 API Key 是否正确设置：\r
\r
```bash\r
python3 scripts/test_config.py\r
```\r
\r
该脚本会检查：\r
- API Key 是否已设置\r
- 是否使用了默认 Key（需要替换为你自己的）\r
- 配置是否可以正常使用\r
\r
### 可选配置 - 飞书通知\r
\r
```bash\r
export FEISHU_WEBHOOK_URL="https://open.feishu.cn/open-apis/bot/v2/hook/xxx"\r
```\r
\r
## 相关文件\r
\r
- `scripts/generate_image.py` - 主脚本\r
- `references/api.md` - API 详细文档\r

Usage Guidance

Install only if you are comfortable sending prompts, reference files, and generated output links to ai.deepsop.com. Do not set FEISHU_WEBHOOK_URL unless you want every run to notify that webhook with prompt text and result links. Avoid using sensitive or private media unless you understand the provider’s hosting, retention, and access controls.

Capability Tags

requires-sensitive-credentials

Capability Assessment

ℹ Purpose & Capability

The core behavior matches the stated purpose: it calls ai.deepsop.com APIs to generate images or videos, polls for completion, can upload reference media, and can optionally download outputs.

⚠ Instruction Scope

The skill uses broad trigger guidance for image/video requests and instructs automatic local reference-media upload; this is purpose-aligned, but can spend credits or transfer files without a strong per-run confirmation step.

✓ Install Mechanism

No package install hook or hidden installer behavior was found; the artifact is documentation, a Python script, references, and tests. The static dynamic-import finding is in tests importing the script under test, not an install-time execution path.

⚠ Credentials

AI_ARTIST_TOKEN is expected for the generation API, but FEISHU_WEBHOOK_URL enables automatic secondary transmission of prompt text and result URLs to a configured webhook without clearly documenting the exact payload or warning at runtime.

ℹ Persistence & Privilege

There is no privilege escalation or durable background worker. The script may write a model-list cache under the temp directory and save generated images only when --download is used.

How to Use

Make sure OpenClaw is installed (local or Docker)
Run the install command in chat: /install deepsop-genvis-ai
After installation, invoke the skill by name or use /deepsop-genvis-ai
Provide required inputs per the skill's parameter spec and get structured output

Version History

v1.0.0

Initial release of deepsop-genvis-ai. - Provides asynchronous AI image and video generation via AI Artist API based on text prompts. - Supports multiple image models (e.g., 3.1Nano2-Evo, S5.0L, N2, W2.7, Image2) and video models (e.g., V3.1FB, S1.5Pro, klingV3Omni, HappyHorse). - Requires users to set the AI_ARTIST_TOKEN environment variable with their personal API Key. - Automatically uploads reference images or videos and polls for task completion. - Includes detailed user guidance for intent clarification, model selection, and parameter confirmation to improve output quality and avoid unexpected results. - Output images and videos can be retrieved via markdown links or local downloads; supports integration with chat platforms.

Metadata

Slug deepsop-genvis-ai

Version 1.0.0

License MIT-0

All-time Installs 0

Active Installs 0

Total Versions 1

Frequently Asked Questions

What is Deepsop Genvis 助手?

AI 图片与视频异步生成技能，调用 AI Artist API 根据文本提示词生成图片或视频，自动轮询直到任务完成。 ⚠️ 使用前必须设置环境变量 AI_ARTIST_TOKEN 为你自己的 API Key！需要 API Key 授权：已有账号请前往 https://ai.deepsop.com/login?s... It is an AI Agent Skill for Claude Code / OpenClaw, with 33 downloads so far.

How do I install Deepsop Genvis 助手?

Run "/install deepsop-genvis-ai" in the OpenClaw or Claude Code chat to install it in one step — no extra setup required.

Is Deepsop Genvis 助手 free?

Yes, Deepsop Genvis 助手 is completely free, licensed under MIT-0. You can download, install and use it at no cost.

Which platforms does Deepsop Genvis 助手 support?

Deepsop Genvis 助手 is cross-platform and runs anywhere OpenClaw / Claude Code is available (cross-platform).

Who created Deepsop Genvis 助手?

It is built and maintained by kukuoAI (@kukuoai); the current version is v1.0.0.

More Skills