Description

腾讯混元生图API - 根据文本描述生成AI图像

README (SKILL.md)

Hunyuan Image - 腾讯混元生图

Name: 腾讯混元生图能力
Author: wszhhx

基于腾讯混元大模型的AI图像生成服务。

功能

文本生成图像
支持多种分辨率
支持多种绘画风格
支持参考图引导
支持超分增强

前置要求

1. 安装Python依赖

pip install tencentcloud-sdk-python

2. 配置腾讯云密钥

需要的环境变量：

TENCENT_SECRET_ID - 腾讯云SecretId
TENCENT_SECRET_KEY - 腾讯云SecretKey

# Windows PowerShell - 永久设置
[Environment]::SetEnvironmentVariable("TENCENT_SECRET_ID", "your-secret-id", "User")
[Environment]::SetEnvironmentVariable("TENCENT_SECRET_KEY", "your-secret-key", "User")

# 或临时设置（当前会话）
$env:TENCENT_SECRET_ID = "your-secret-id"
$env:TENCENT_SECRET_KEY = "your-secret-key"

获取密钥步骤：

访问 https://console.cloud.tencent.com/cam/capi
点击「新建密钥」
复制 SecretId 和 SecretKey
⚠️ 注意：SecretKey 只显示一次，请妥善保存

3. 验证配置

# 检查环境变量是否已设置
if ($env:TENCENT_SECRET_ID -and $env:TENCENT_SECRET_KEY) {
    Write-Host "✅ 环境变量已配置"
} else {
    Write-Host "❌ 请设置 TENCENT_SECRET_ID 和 TENCENT_SECRET_KEY"
}

# 测试生成
python scripts/generate.py "一只小猫"

使用方法

基础用法

# 生成图片
python {baseDir}/scripts/generate.py "雨中竹林小路"

# 指定风格
python {baseDir}/scripts/generate.py "少女, 樱花, 动漫风格" --style 201

# 指定分辨率
python {baseDir}/scripts/generate.py "未来城市" --resolution 1024:768

# 生成多张
python {baseDir}/scripts/generate.py "山水画" --num 4

参数说明

参数	说明	示例
prompt	文本描述（必填）	"雨中竹林小路"
--style	绘画风格编号	201（动漫）
--resolution	分辨率	1024:1024, 768:1024
--num	生成数量（1-4）	2
--negative	反向提示词	"黑色,模糊"
--clarity	超分选项	x2, x4
--seed	随机种子	12345
--logo	添加水印（API级别，默认不添加）	可选
--output	输出目录	./images

风格列表（常用）

编号	风格
101	水墨画
102	概念艺术
103	油画
104	水彩画
201	动漫
202	日本动画
301	3D卡通
401	肖像画
501	赛博朋克
601	蒸汽波

完整列表：https://cloud.tencent.com/document/product/1729/105846

输出

生成的图片保存在 {output}/{date}/{job_id}/ 目录下：

image_0.png - 生成的图片
info.json - 任务信息（包含扩写后的描述）

注意事项

异步接口：API是异步的，需要等待任务完成
并发限制：默认1个并发
地域限制：仅支持 ap-guangzhou
Prompt扩写：默认开启，可提升生成效果
水印：默认不添加水印。使用 --logo 参数可添加"图片由AI生成"水印

踩坑记录

1. 状态码陷阱 ⚠️

坑：API返回 JobStatusCode: 5 可能是成功！需要检查 ResultDetails：

if status == '4' or (status == '5' and result.get('ResultDetails') == ['Success']):
    print('✅ 实际生成成功！')
    # 处理图片...

2. Prompt内容限制 🚫

坑：某些历史人物名字可能触发内容审核

实测结果：

Prompt	结果
"李白"	❌ 失败
"唐朝诗人李白"	❌ 失败
"古代诗人，白衣少年"	✅ 成功
"一只可爱的猫咪"	✅ 成功

建议：避免直接使用敏感历史人物全名，用描述性词汇替代

3. 网络超时问题 🌐

坑：API偶尔连接超时（ConnectTimeoutError）

解决：

增加重试机制
设置合理的超时时间（60秒以上）
使用稳定的网络环境

4. 风格编号无效 ❌

坑：文档中的风格编号 201 实际调用时报错 StyleId参数有误

解决：不传 --style 参数，让API自动选择默认风格

5. 图片下载超时问题 ⏱️

坑：下载大图片时可能超时

解决：增加超时时间设置

# 设置合理的超时时间（30秒）
urllib.request.urlopen(req, timeout=30)

6. Prompt扩写效果 ✨

惊喜：开启扩写（默认）后，简单描述会被AI优化为详细描述

示例：

输入："一只可爱的猫咪"
扩写后："一只可爱的猫咪，拥有圆润的身体和柔软的毛发，它的眼睛大而圆，流露出友好的笑容..."

建议：保持原始描述简洁，让AI自动扩写提升效果

8. 并发限制 ⏳

坑：默认只有1个并发，同时提交多个任务会排队

解决：

顺序执行，等待前一个完成
或购买更多并发额度

最佳实践 💡

Prompt编写：简洁描述 + 让AI扩写 > 冗长描述
错误处理：检查 ResultDetails 而不仅是状态码
内容规避：用"古代诗人"代替"李白"，用"美少女"代替具体人名
网络重试：生产环境务必添加重试机制
分辨率：竖版推荐 768:1024，横版推荐 1024:768

示例

# 生成动漫风格头像
python scripts/generate.py "可爱女孩, 短发, 微笑, 樱花背景" --style 201 --resolution 768:768

# 生成赛博朋克壁纸
python scripts/generate.py "未来城市, 霓虹灯, 雨夜" --style 501 --resolution 1920:1080 --clarity x2

# 生成水墨画
python scripts/generate.py "山水, 瀑布, 松树, 云雾" --style 101 --resolution 1024:768

许可证

MIT License

English Version

Usage Guidance

该技能看起来如其所述：用你的腾讯云密钥调用混元生图并将生成的图片保存到本地。注意事项： - 只在你信任的环境中提供腾讯云密钥；使用具有最小权限的子账号/临时密钥而非主账号密钥。 - pip install 会从 PyPI 安装依赖，安装第三方包存在供应链风险；如有顾虑，在隔离环境（虚拟环境或容器）中运行。 - 运行脚本会把你的 prompt 和生成的任务提交到腾讯云（在腾讯云处理并返回图片 URL），请评估隐私/合规影响。 - 如果需要更高信心，可审阅 scripts/generate.py 源码（已包含）并验证 tencentcloud-sdk-python 包来源或使用锁定版本。

Capability Analysis

Type: OpenClaw Skill Name: hunyuan-image Version: 1.0.3 The skill bundle is a legitimate implementation for interacting with the Tencent Hunyuan Image generation API. It uses the official 'tencentcloud-sdk-python' library and follows standard practices for cloud service integration, including the use of environment variables for authentication and official API endpoints (hunyuan.tencentcloudapi.com). The code in 'scripts/generate.py' is well-structured, lacks any dangerous execution patterns (like eval or unsanitized shell commands), and performs only the actions described in the documentation.

Capability Assessment

✓ Purpose & Capability

名称/描述均为“根据文本生成图片”。所需二进制（python）、Python 包（tencentcloud-sdk-python）、以及环境变量（TENCENT_SECRET_ID/TENCENT_SECRET_KEY）直接对应调用腾讯云 Hunyuan 生图 API 的需要，合理且成比例。

✓ Instruction Scope

SKILL.md 指示仅安装 SDK、设置凭据并运行 scripts/generate.py。运行时只读取声明的环境变量、向腾讯云 API 发起请求并下载 API 返回的图片 URL；没有指示读取其它系统凭证或任意主机路径，也未指示向不明第三方上报数据。

✓ Install Mechanism

无安装脚本，说明文件和 package.yaml 建议通过 pip install tencentcloud-sdk-python。通过 PyPI 安装官方 SDK 是正常且可预期的方式（注意：pip 包安装存在第三方包风险，但这与技能目的相称）。

✓ Credentials

仅要求 TENCENT_SECRET_ID 和 TENCENT_SECRET_KEY 作为主凭据，数量和命名都与调用腾讯云 API 的需要一致。无其它不相关密钥或配置路径要求。

✓ Persistence & Privilege

技能未请求常驻(always:false)，也不修改其它技能或全局代理设置。它以正常、有限权限（使用用户提供的腾讯云密钥）运行。

Version History

v1.0.3

- Updated skill metadata for compatibility with Clawdbot, adding an emoji and specifying the primary required environment variable. - No other user-facing functionality or documentation changes.

v1.0.2

hunyuan-image 1.0.2 功能优化：默认不添加水印，使用 --logo 参数可选添加元数据完善：添加 package.yaml 完整声明依赖和环境变量要求

v1.0.1

- 初始版本发布：基于腾讯混元大模型的 AI 图像生成工具 - 支持文生图，可根据文本描述智能生成图像 - 提供多种分辨率选项，适配不同使用场景 - 内置多种艺术风格（动漫、油画、水彩、赛博朋克等） - 支持超分增强（x2/x4），提升图像清晰度 - 支持参考图引导，基于现有图片生成新图像 - 需要腾讯云 API 密钥 - 文档包含详细的错误处理建议、最佳实践和常见问题解决方案 --1.0.1 - 安全修复：移除 SSL 证书验证禁用代码，使用标准 HTTPS 连接 - 安全修复：移除文档中展示 SecretKey 的示例代码，改为仅检查变量是否存在 - 文档修正：统一水印相关描述，明确 API 默认添加水印的行为

v1.0.0

- 初始版本发布：基于腾讯混元大模型API的 AI 图像生成工具 - 支持文生图，可根据文本描述智能生成图像 - 提供多种分辨率选项，适配不同使用场景 - 内置多种艺术风格（动漫、油画、水彩、赛博朋克等） - 支持超分增强（x2/x4），提升图像清晰度 - 支持参考图引导，基于现有图片生成新图像 - 需要腾讯云 API 密钥 - 文档包含详细的错误处理建议、最佳实践和常见问题解决方案

Metadata

Slug hunyuan-image

Version 1.0.3

License —

All-time Installs 4

Active Installs 4

Total Versions 4

Frequently Asked Questions

What is 腾讯混元生图能力?

腾讯混元生图API - 根据文本描述生成AI图像. It is an AI Agent Skill for Claude Code / OpenClaw, with 404 downloads so far.

How do I install 腾讯混元生图能力?

Run "/install hunyuan-image" in the OpenClaw or Claude Code chat to install it in one step — no extra setup required.

Is 腾讯混元生图能力 free?

Yes, 腾讯混元生图能力 is completely free (open-source). You can download, install and use it at no cost.

Which platforms does 腾讯混元生图能力 support?

腾讯混元生图能力 is cross-platform and runs anywhere OpenClaw / Claude Code is available (cross-platform).

Who created 腾讯混元生图能力?

It is built and maintained by Tony (@wszhhx); the current version is v1.0.3.

More Skills

腾讯混元生图能力