← 返回 Skills 市场
44
总下载
1
收藏
0
当前安装
1
版本数
在 OpenClaw 中安装
/install gpt-image-2-shiyunapi
功能描述
【功能】通过 GPT-image-2 模型完成文生图和基于图片的编辑/修图,通过诗云API(ShiyunApi)提供GPT-image-2 模型服务。 【场景】用户要生成图片、画图、做海报/头像/封面/插画/产品图,或要修改图片、局部重绘、换背景、合成多张图、调整风格、基于参考图生成新图时触发。 【输入】文本提示...
使用说明 (SKILL.md)
ShiyunApi GPT-image-2 图片生成与编辑
功能
通过诗云API / ShiyunApi 的 GPT-image-2 图片接口完成两类任务:
- 文生图:
POST https://shiyunapi.com/v1/images/generations,由文本提示词生成全新图片。 - 图片编辑:
POST https://shiyunapi.com/v1/images/edits,基于一张或多张输入图片进行修改、局部重绘、换背景、风格调整或合成。
核心判断:
- 用户只提供文字并要求“生成、画、做、设计一张新图片”时,走文生图流程,运行
scripts/generate_image.py。 - 用户提供或引用已有图片,并要求“修改、参考、合成、换背景、局部重绘、把这张图改成……”时,走图片编辑流程,运行
scripts/edit_image.py。 - 用户需求是视频、本地离线修图、截图、压缩、裁剪或其他供应商时,不使用本技能,除非用户明确要求切换到 ShiyunApi。
能力边界
支持:
- 中文/英文提示词文生图。
- 海报、头像、封面、插画、产品图、电商图、宣传图、概念图、角色设定图、场景图等新图片生成。
- 基于一张或多张
png/jpg/jpeg/webp图片进行编辑。 - 换背景、保留主体、改变风格、多图合成、局部补全或重绘。
- 可选使用
mask遮罩图进行局部编辑;完全透明区域表示需要编辑的位置。 - 指定模型、数量、尺寸、质量、输出格式、背景透明度、审核级别等参数。
- 保存 URL 图片、base64 图片或原始 JSON 响应。
不支持:
- 视频生成、图生视频、视频续写。
- 本地离线图片处理、截图、压缩、裁剪、无 API 的离线修图。
- 非 ShiyunApi 的图片供应商,除非用户明确要求改用 ShiyunApi。
执行流程
- 判断任务类型:
- 无输入图片且目标是创建新图:选择文生图。
- 有输入图片、参考图、遮罩或“修改这张图”的目标:选择图片编辑。
- 提取提示词;缺失时先询问用户想生成什么或如何修改图片。
- 编辑场景提取待编辑图片路径;缺失时先询问用户提供图片文件。
- 校验 API Key:优先读取
SHIYUN_API_KEY。 - 用户直接提供 API Key 时,运行
scripts/save_api_key.py --api-key-stdin持久化;通过 stdin 传入,不写入文档、日志或 memory。 - 需要确认接口限制时读取
references/api_docs.md;需要示例时读取references/examples.md;遇到失败时读取references/troubles.md。 - 根据任务类型运行对应脚本。
- 检查输出:有图片则交付图片;只有 JSON 则说明响应结构和下一步。
参数
通用参数
prompt:必填,图片生成或编辑提示词。model:可选,默认gpt-image-2。n:可选,默认1,范围1到10。size:可选,默认1024x1024;常用1024x1024、1536x1024、1024x1536、auto。quality:可选,默认auto;常用high、medium、low、auto。format:可选,默认png,用于保存图片,可为png/jpeg/webp。output_dir:可选,默认应使用当前工作区下的任务专属目录。
文生图专用参数
model_field:可选,默认model;接口字段异常时可用modal或auto。format:会作为 JSON 请求体字段传给接口。
图片编辑专用参数
image/images:必填,待编辑图片路径,可传一张或多张。mask:可选,遮罩 PNG;透明区域表示要编辑的位置;应小于 4MB 且尺寸与第一张图片一致。background:可选,默认auto,支持transparent、opaque、auto。moderation:可选,默认auto,支持low、auto。response_format:可选,仅dall-e-2使用;gpt-image-2默认按 base64/URL 响应解析,不要主动传该参数。
调用脚本
文生图
python "scripts/generate_image.py" \
--prompt "一只穿宇航服的小龙虾,赛博朋克海报风格" \
--model gpt-image-2 \
--n 1 \
--size 1024x1024 \
--quality auto \
--format png \
--output-dir "C:/path/to/output"
编辑单张图片
python "scripts/edit_image.py" \
--image "C:/path/to/input.png" \
--prompt "保留主体,把背景改成雪山日出,真实摄影风格" \
--model gpt-image-2 \
--n 1 \
--size 1024x1024 \
--quality auto \
--output-dir "C:/path/to/output"
编辑多张参考图并合成
python "scripts/edit_image.py" \
--image "C:/path/to/person.png" \
--image "C:/path/to/product.png" \
--prompt "将人物和产品自然合成到同一张电商海报中,保留人物面部特征" \
--model gpt-image-2 \
--output-dir "C:/path/to/output"
局部编辑
python "scripts/edit_image.py" \
--image "C:/path/to/input.png" \
--mask "C:/path/to/mask.png" \
--prompt "只修改透明遮罩区域,将天空改成晚霞" \
--output-dir "C:/path/to/output"
保存用户提供的 API Key
python "scripts/save_api_key.py" --api-key-stdin
通过 stdin 传入 Key,避免把 Key 暴露在命令文本、日志或历史记录中。
脚本行为
scripts/generate_image.py:
- 发送
POST https://shiyunapi.com/v1/images/generations。 - 添加
Content-Type: application/json、Accept: application/json、Authorization: Bearer \x3Ckey>。 - 校验
prompt、n、quality、format、size。 - 默认使用请求字段
model;必要时支持--model-field modal。 - 使用
--model-field auto时,仅在疑似参数校验失败后重试 alternate field;提醒用户重试可能消耗额度。
scripts/edit_image.py:
- 发送
POST https://shiyunapi.com/v1/images/edits。 - 添加
Accept: application/json、Authorization: Bearer \x3Ckey>,请求体使用multipart/form-data。 - 校验
image、mask、prompt、n、size、quality、background、moderation、response_format。 - 将每个
--image作为image字段重复上传,兼容多图数组语义。
两个脚本都会:
- 遇到
url字段时下载图片。 - 遇到
b64_json、base64、image_base64字段时保存图片。 - 遇到未知结构时保存
response.json。 - 输出
metadata.json记录接口、状态、原始响应路径和保存文件路径。
输出
成功时:
{
"code": 0,
"files": ["C:/path/to/image_1.png"],
"msg": "图片生成或编辑成功"
}
未返回图片但有响应时:
{
"code": 202,
"raw_response": "C:/path/to/response.json",
"msg": "已保存原始响应,请根据接口返回继续处理"
}
异常处理
- 未检测到 API Key:提示进入
https://shiyunapi.com/console/token创建 Key,并设置SHIYUN_API_KEY。 401/403:提示检查 API Key 和 Bearer 授权格式。- 余额/额度不足:提示进入
https://shiyunapi.com/console/topup充值后重试。 400/422:- 文生图优先检查
prompt、model/modal、n、size、quality、format。 - 图片编辑优先检查图片格式/大小、
prompt、model、n、size、quality、mask。
- 文生图优先检查
413:提示图片文件过大;编辑场景单图应小于 25MB,遮罩应小于 4MB。- 非 2xx:提取
error、message、msg、code、detail后说明失败原因。 - 多次出现错误,但无法确定原因提示进入
https://shiyunapi.com/customersupport联系客服寻求帮助。 - 未知响应:保存原始响应并总结 HTTP 状态,不暴露密钥。
已知接口文档问题
- 文生图文档 schema 写
modal,示例请求写model;默认先用model。 - 图片编辑文档中标题/标签/model 名称存在 GPT Image-1 与 GPT-image-2 混写;本合并技能默认使用
gpt-image-2。 - 响应示例可能是 chat completion 结构,不一定是真实图片生成/编辑结构。
- Header 表中 Authorization 标为可选,但实际按必填处理。
安全规则
- 不把 API Key 写入
SKILL.md、reference、memory 或项目文件。 - 优先使用
SHIYUN_API_KEY,避免用命令行--api-key。 - 用户提供 Key 时,用
save_api_key.py --api-key-stdin保存。 - 对日志、报错、总结中的 Authorization 和 Key 做脱敏。
- 未经用户明确要求,不把用户图片、生成结果或提示词上传到其他服务。
安全使用建议
This skill is reasonable to install if you intend to use ShiyunApi for image generation/editing. Before using it, decide whether you want the API key saved persistently, use a limited key if possible, and avoid uploading sensitive personal or business images unless you trust ShiyunApi's data handling.
功能分析
Type: OpenClaw Skill
Name: gpt-image-2-shiyunapi
Version: 1.0.0
The skill bundle provides a legitimate integration for image generation and editing via the ShiyunApi service. The scripts (generate_image.py, edit_image.py) implement standard API interaction logic with security-conscious features such as API key redaction in error messages and input validation. A utility script (save_api_key.py) allows users to persist their API key by modifying shell configuration files (.bashrc, .zshrc) or Windows environment variables via setx; while this involves system modification, it is transparently documented in SKILL.md and serves the stated purpose of the skill. No evidence of data exfiltration, malicious code execution, or harmful prompt injection was found.
能力标签
能力评估
Purpose & Capability
The stated purpose, scripts, and references consistently support GPT-image-2 text-to-image and image-editing through ShiyunApi. The noteworthy part is that this is a cloud API workflow, not local-only image processing.
Instruction Scope
The instructions choose generation vs. editing based on the user's task, ask for missing prompts or images, and do not show goal hijacking or forced use outside the stated image workflow.
Install Mechanism
There is no install spec and the included scripts appear to use Python standard-library modules. The registry lists source/homepage as unknown/none, and the static secret finding appears to be a false positive on a user-supplied API-key variable.
Credentials
The scripts send prompts, optional input images, and a Bearer API key to shiyunapi.com, then save returned images/JSON locally. This is proportional to the service, though the registry metadata under-declares the API key/env-var need.
Persistence & Privilege
The helper can save SHIYUN_API_KEY persistently in the user's environment or shell profile by default. This is disclosed and purpose-aligned, but users may prefer temporary/process-only credential use.
如何使用
- 确保已安装 OpenClaw(本地或 Docker 部署)
- 在对话框中输入安装命令:
/install gpt-image-2-shiyunapi - 安装完成后,直接呼叫该 Skill 的名称或使用
/gpt-image-2-shiyunapi触发 - 根据 Skill 的参数说明提供必要输入,即可获得结构化输出
版本历史
v1.0.0
GPT-image-2 图片生成与编辑技能首次上线,支持通过诗云API进行多场景图片生成与修图。
- 基于文本提示生成全新图片(文生图)或对现有图片进行编辑、合成、局部重绘、换背景等操作。
- 同时支持多张图片合成与遮罩指定区域编辑。
- 输出 PNG/JPEG/WebP 格式图片,原始响应 JSON 便于排错。
- 灵活参数支持模型选择、图片数量、尺寸、质量、格式等。
- 强化异常处理与错误提示,并保护用户 API Key 信息安全。
元数据
常见问题
GPT-image-2 图片生成与编辑 诗云API 是什么?
【功能】通过 GPT-image-2 模型完成文生图和基于图片的编辑/修图,通过诗云API(ShiyunApi)提供GPT-image-2 模型服务。 【场景】用户要生成图片、画图、做海报/头像/封面/插画/产品图,或要修改图片、局部重绘、换背景、合成多张图、调整风格、基于参考图生成新图时触发。 【输入】文本提示... 它是一个面向 Claude Code / OpenClaw 的 AI Agent Skill 插件,目前累计下载 44 次。
如何安装 GPT-image-2 图片生成与编辑 诗云API?
在 OpenClaw 或 Claude Code 对话框中运行命令「/install gpt-image-2-shiyunapi」即可一键安装,无需额外配置。
GPT-image-2 图片生成与编辑 诗云API 是免费的吗?
是的,GPT-image-2 图片生成与编辑 诗云API 完全免费,采用 MIT-0 许可证,可自由下载、安装和使用。
GPT-image-2 图片生成与编辑 诗云API 支持哪些平台?
GPT-image-2 图片生成与编辑 诗云API 跨平台运行,可在任意部署了 OpenClaw / Claude Code 的环境中使用(cross-platform)。
谁开发了 GPT-image-2 图片生成与编辑 诗云API?
由 ShiyunApi(@gl894761214)开发并维护,当前版本 v1.0.0。
推荐 Skills