功能描述

【功能】通过 GPT-image-2 模型完成文生图和基于图片的编辑/修图，通过诗云API(ShiyunApi)提供GPT-image-2 模型服务。【场景】用户要生成图片、画图、做海报/头像/封面/插画/产品图，或要修改图片、局部重绘、换背景、合成多张图、调整风格、基于参考图生成新图时触发。【输入】文本提示...

使用说明 (SKILL.md)

ShiyunApi GPT-image-2 图片生成与编辑

Name: GPT-image-2 图片生成与编辑 诗云API
Author: gl894761214

功能

通过诗云API / ShiyunApi 的 GPT-image-2 图片接口完成两类任务：

文生图：POST https://shiyunapi.com/v1/images/generations，由文本提示词生成全新图片。
图片编辑：POST https://shiyunapi.com/v1/images/edits，基于一张或多张输入图片进行修改、局部重绘、换背景、风格调整或合成。

核心判断：

用户只提供文字并要求“生成、画、做、设计一张新图片”时，走文生图流程，运行 scripts/generate_image.py。
用户提供或引用已有图片，并要求“修改、参考、合成、换背景、局部重绘、把这张图改成……”时，走图片编辑流程，运行 scripts/edit_image.py。
用户需求是视频、本地离线修图、截图、压缩、裁剪或其他供应商时，不使用本技能，除非用户明确要求切换到 ShiyunApi。

能力边界

支持：

中文/英文提示词文生图。
海报、头像、封面、插画、产品图、电商图、宣传图、概念图、角色设定图、场景图等新图片生成。
基于一张或多张 png / jpg / jpeg / webp 图片进行编辑。
换背景、保留主体、改变风格、多图合成、局部补全或重绘。
可选使用 mask 遮罩图进行局部编辑；完全透明区域表示需要编辑的位置。
指定模型、数量、尺寸、质量、输出格式、背景透明度、审核级别等参数。
保存 URL 图片、base64 图片或原始 JSON 响应。

不支持：

视频生成、图生视频、视频续写。
本地离线图片处理、截图、压缩、裁剪、无 API 的离线修图。
非 ShiyunApi 的图片供应商，除非用户明确要求改用 ShiyunApi。

执行流程

判断任务类型：
- 无输入图片且目标是创建新图：选择文生图。
- 有输入图片、参考图、遮罩或“修改这张图”的目标：选择图片编辑。
提取提示词；缺失时先询问用户想生成什么或如何修改图片。
编辑场景提取待编辑图片路径；缺失时先询问用户提供图片文件。
校验 API Key：优先读取 SHIYUN_API_KEY。
用户直接提供 API Key 时，运行 scripts/save_api_key.py --api-key-stdin 持久化；通过 stdin 传入，不写入文档、日志或 memory。
需要确认接口限制时读取 references/api_docs.md；需要示例时读取 references/examples.md；遇到失败时读取 references/troubles.md。
根据任务类型运行对应脚本。
检查输出：有图片则交付图片；只有 JSON 则说明响应结构和下一步。

参数

通用参数

prompt：必填，图片生成或编辑提示词。
model：可选，默认 gpt-image-2。
n：可选，默认 1，范围 1 到 10。
size：可选，默认 1024x1024；常用 1024x1024、1536x1024、1024x1536、auto。
quality：可选，默认 auto；常用 high、medium、low、auto。
format：可选，默认 png，用于保存图片，可为 png / jpeg / webp。
output_dir：可选，默认应使用当前工作区下的任务专属目录。

文生图专用参数

model_field：可选，默认 model；接口字段异常时可用 modal 或 auto。
format：会作为 JSON 请求体字段传给接口。

图片编辑专用参数

image / images：必填，待编辑图片路径，可传一张或多张。
mask：可选，遮罩 PNG；透明区域表示要编辑的位置；应小于 4MB 且尺寸与第一张图片一致。
background：可选，默认 auto，支持 transparent、opaque、auto。
moderation：可选，默认 auto，支持 low、auto。
response_format：可选，仅 dall-e-2 使用；gpt-image-2 默认按 base64/URL 响应解析，不要主动传该参数。

调用脚本

文生图

python "scripts/generate_image.py" \
  --prompt "一只穿宇航服的小龙虾，赛博朋克海报风格" \
  --model gpt-image-2 \
  --n 1 \
  --size 1024x1024 \
  --quality auto \
  --format png \
  --output-dir "C:/path/to/output"

编辑单张图片

python "scripts/edit_image.py" \
  --image "C:/path/to/input.png" \
  --prompt "保留主体，把背景改成雪山日出，真实摄影风格" \
  --model gpt-image-2 \
  --n 1 \
  --size 1024x1024 \
  --quality auto \
  --output-dir "C:/path/to/output"

编辑多张参考图并合成

python "scripts/edit_image.py" \
  --image "C:/path/to/person.png" \
  --image "C:/path/to/product.png" \
  --prompt "将人物和产品自然合成到同一张电商海报中，保留人物面部特征" \
  --model gpt-image-2 \
  --output-dir "C:/path/to/output"

局部编辑

python "scripts/edit_image.py" \
  --image "C:/path/to/input.png" \
  --mask "C:/path/to/mask.png" \
  --prompt "只修改透明遮罩区域，将天空改成晚霞" \
  --output-dir "C:/path/to/output"

保存用户提供的 API Key

python "scripts/save_api_key.py" --api-key-stdin

通过 stdin 传入 Key，避免把 Key 暴露在命令文本、日志或历史记录中。

脚本行为

scripts/generate_image.py：

发送 POST https://shiyunapi.com/v1/images/generations。
添加 Content-Type: application/json、Accept: application/json、Authorization: Bearer \x3Ckey>。
校验 prompt、n、quality、format、size。
默认使用请求字段 model；必要时支持 --model-field modal。
使用 --model-field auto 时，仅在疑似参数校验失败后重试 alternate field；提醒用户重试可能消耗额度。

scripts/edit_image.py：

发送 POST https://shiyunapi.com/v1/images/edits。
添加 Accept: application/json、Authorization: Bearer \x3Ckey>，请求体使用 multipart/form-data。
校验 image、mask、prompt、n、size、quality、background、moderation、response_format。
将每个 --image 作为 image 字段重复上传，兼容多图数组语义。

两个脚本都会：

遇到 url 字段时下载图片。
遇到 b64_json、base64、image_base64 字段时保存图片。
遇到未知结构时保存 response.json。
输出 metadata.json 记录接口、状态、原始响应路径和保存文件路径。

输出

成功时：

{
  "code": 0,
  "files": ["C:/path/to/image_1.png"],
  "msg": "图片生成或编辑成功"
}

未返回图片但有响应时：

{
  "code": 202,
  "raw_response": "C:/path/to/response.json",
  "msg": "已保存原始响应，请根据接口返回继续处理"
}

异常处理

未检测到 API Key：提示进入 https://shiyunapi.com/console/token 创建 Key，并设置 SHIYUN_API_KEY。
401 / 403：提示检查 API Key 和 Bearer 授权格式。
余额/额度不足：提示进入 https://shiyunapi.com/console/topup 充值后重试。
400 / 422：
- 文生图优先检查 prompt、model/modal、n、size、quality、format。
- 图片编辑优先检查图片格式/大小、prompt、model、n、size、quality、mask。
413：提示图片文件过大；编辑场景单图应小于 25MB，遮罩应小于 4MB。
非 2xx：提取 error、message、msg、code、detail 后说明失败原因。
多次出现错误，但无法确定原因提示进入 https://shiyunapi.com/customersupport 联系客服寻求帮助。
未知响应：保存原始响应并总结 HTTP 状态，不暴露密钥。

已知接口文档问题

文生图文档 schema 写 modal，示例请求写 model；默认先用 model。
图片编辑文档中标题/标签/model 名称存在 GPT Image-1 与 GPT-image-2 混写；本合并技能默认使用 gpt-image-2。
响应示例可能是 chat completion 结构，不一定是真实图片生成/编辑结构。
Header 表中 Authorization 标为可选，但实际按必填处理。

安全规则

不把 API Key 写入 SKILL.md、reference、memory 或项目文件。
优先使用 SHIYUN_API_KEY，避免用命令行 --api-key。
用户提供 Key 时，用 save_api_key.py --api-key-stdin 保存。
对日志、报错、总结中的 Authorization 和 Key 做脱敏。
未经用户明确要求，不把用户图片、生成结果或提示词上传到其他服务。

安全使用建议

This skill is reasonable to install if you intend to use ShiyunApi for image generation/editing. Before using it, decide whether you want the API key saved persistently, use a limited key if possible, and avoid uploading sensitive personal or business images unless you trust ShiyunApi's data handling.

功能分析

Type: OpenClaw Skill Name: gpt-image-2-shiyunapi Version: 1.0.0 The skill bundle provides a legitimate integration for image generation and editing via the ShiyunApi service. The scripts (generate_image.py, edit_image.py) implement standard API interaction logic with security-conscious features such as API key redaction in error messages and input validation. A utility script (save_api_key.py) allows users to persist their API key by modifying shell configuration files (.bashrc, .zshrc) or Windows environment variables via setx; while this involves system modification, it is transparently documented in SKILL.md and serves the stated purpose of the skill. No evidence of data exfiltration, malicious code execution, or harmful prompt injection was found.

能力标签

cryptocan-make-purchasesrequires-oauth-tokenrequires-sensitive-credentials

能力评估

ℹ Purpose & Capability

The stated purpose, scripts, and references consistently support GPT-image-2 text-to-image and image-editing through ShiyunApi. The noteworthy part is that this is a cloud API workflow, not local-only image processing.

✓ Instruction Scope

The instructions choose generation vs. editing based on the user's task, ask for missing prompts or images, and do not show goal hijacking or forced use outside the stated image workflow.

ℹ Install Mechanism

There is no install spec and the included scripts appear to use Python standard-library modules. The registry lists source/homepage as unknown/none, and the static secret finding appears to be a false positive on a user-supplied API-key variable.

ℹ Credentials

The scripts send prompts, optional input images, and a Bearer API key to shiyunapi.com, then save returned images/JSON locally. This is proportional to the service, though the registry metadata under-declares the API key/env-var need.

ℹ Persistence & Privilege

The helper can save SHIYUN_API_KEY persistently in the user's environment or shell profile by default. This is disclosed and purpose-aligned, but users may prefer temporary/process-only credential use.

版本历史

v1.0.0

GPT-image-2 图片生成与编辑技能首次上线，支持通过诗云API进行多场景图片生成与修图。 - 基于文本提示生成全新图片（文生图）或对现有图片进行编辑、合成、局部重绘、换背景等操作。 - 同时支持多张图片合成与遮罩指定区域编辑。 - 输出 PNG/JPEG/WebP 格式图片，原始响应 JSON 便于排错。 - 灵活参数支持模型选择、图片数量、尺寸、质量、格式等。 - 强化异常处理与错误提示，并保护用户 API Key 信息安全。

元数据

Slug gpt-image-2-shiyunapi

版本 1.0.0

许可证 MIT-0

累计安装 0

当前安装数 0

历史版本数 1

常见问题

GPT-image-2 图片生成与编辑诗云API 是什么？

【功能】通过 GPT-image-2 模型完成文生图和基于图片的编辑/修图，通过诗云API(ShiyunApi)提供GPT-image-2 模型服务。【场景】用户要生成图片、画图、做海报/头像/封面/插画/产品图，或要修改图片、局部重绘、换背景、合成多张图、调整风格、基于参考图生成新图时触发。【输入】文本提示... 它是一个面向 Claude Code / OpenClaw 的 AI Agent Skill 插件，目前累计下载 44 次。

如何安装 GPT-image-2 图片生成与编辑诗云API？

在 OpenClaw 或 Claude Code 对话框中运行命令「/install gpt-image-2-shiyunapi」即可一键安装，无需额外配置。

GPT-image-2 图片生成与编辑诗云API 是免费的吗？

是的，GPT-image-2 图片生成与编辑诗云API 完全免费，采用 MIT-0 许可证，可自由下载、安装和使用。

GPT-image-2 图片生成与编辑诗云API 支持哪些平台？

GPT-image-2 图片生成与编辑诗云API 跨平台运行，可在任意部署了 OpenClaw / Claude Code 的环境中使用（cross-platform）。

谁开发了 GPT-image-2 图片生成与编辑诗云API？

由 ShiyunApi（@gl894761214）开发并维护，当前版本 v1.0.0。

GPT-image-2 图片生成与编辑 诗云API