← 返回 Skills 市场
Qwen3-TTS Voice Synthesis
作者
vincentlau2046-sudo
· GitHub ↗
· v1.0.0
· MIT-0
40
总下载
0
收藏
0
当前安装
1
版本数
在 OpenClaw 中安装
/install tts-qwen3
功能描述
Qwen3-TTS 本地语音合成。支持音色克隆、声音设计、多角色对话。琪琪OPC首选TTS,失败回退到 tts-cosyvoice (Edge TTS)。
使用说明 (SKILL.md)
Qwen3-TTS 本地语音合成
基于 Qwen3-TTS 1.7B 模型,支持音色克隆 + 声音设计 + 多角色对话。 琪琪OPC 首选 TTS,失败时回退到 tts-cosyvoice (Edge TTS)。
优先级
Qwen3-TTS(本地GPU,音色克隆+设计)→ Edge TTS(tts-cosyvoice,云端回退)
琪琪OPC 音色库
6 个角色音色,通过 ComfyUI API 调用:
| 角色 | 音色名 | 方式 | 说明 | 用途 |
|---|---|---|---|---|
| 🐰 琪琪 | qiqi_clone | 克隆 | ref_audio=qiqi_voice_v3.wav | 琪琪对话 |
| 📖 旁白 | narrator_teacher | VoiceDesign | seed=100, 温暖女声 | 叙事 |
| 👦 男孩 | boy_child | VoiceDesign | seed=200, 活泼8岁 | 儿童男角 |
| 👧 女孩 | girl_child | VoiceDesign | seed=300, 甜美7岁 | 儿童女角 |
| 👨 大人男 | adult_male | VoiceDesign | seed=400, 沉稳 | 成年男角 |
| 👩 大人女 | adult_female | VoiceDesign | seed=500, 优雅 | 成年女角 |
脚本
单角色 TTS
python3 {baseDir}/scripts/qwen_tts.py \
--text "你好,我是琪琪" \
--voice qiqi_clone \
--output /tmp/output.wav
多角色对话 TTS
python3 {baseDir}/scripts/qwen_tts_dialogue.py \
--script "琪琪:你好呀!\
旁白:琪琪开心地笑了。" \
--output /tmp/dialogue.wav \
--srt /tmp/dialogue.srt
选项
| 选项 | 默认 | 说明 |
|---|---|---|
--text |
(必需) | 要合成的文本 |
--voice |
narrator_teacher | 音色名(见音色库) |
--output |
/tmp/qwen_tts_output.wav | 输出文件路径 |
--language |
Chinese | 语言 |
--model |
1.7B | 模型大小 (0.6B/1.7B) |
--attention |
sdpa | 注意力机制 |
--fallback-edge |
true | 失败时回退到 Edge TTS |
对话脚本格式
角色名: 台词内容
角色名: 台词内容
角色名映射到音色库中的音色。旁白 映射到 narrator_teacher。
依赖
- ComfyUI 运行中(localhost:8188)
- ComfyUI-Qwen-TTS 插件已安装
- Qwen3-TTS 模型已下载(~/ComfyUI/models/qwen-tts/)
- comfyui-venv Python 环境
回退策略
当 Qwen3-TTS 不可用时(ComfyUI 未启动 / GPU 显存不足 / 生成失败), 自动回退到 Edge TTS (tts-cosyvoice):
- 琪琪 → zh-CN-XiaoyiNeural
- 旁白 → zh-CN-XiaoxiaoNeural
- 男孩 → zh-CN-YunxiNeural
- 女孩 → zh-CN-XiaoyiNeural
- 大人男 → zh-CN-YunjianNeural
- 大人女 → zh-CN-XiaoxiaoNeural
版本: v1.0 | 琪琪OPC 首选 TTS | 基于 Qwen3-TTS + ComfyUI
安全使用建议
Install only if you are comfortable with possible off-device text processing. Keep COMFYUI_URL set to localhost or another trusted ComfyUI server, avoid sensitive text unless you disable fallback with --fallback-edge false, and review or install the referenced tts-cosyvoice dependency before relying on fallback output.
能力评估
Purpose & Capability
The ComfyUI Qwen3-TTS workflow, voice presets, audio conversion, and output writing fit the stated voice-synthesis purpose, but the documented dialogue helper is absent and the local-TTS framing is weakened by automatic fallback behavior.
Instruction Scope
SKILL.md discloses Edge TTS fallback and the fallback flag, but it does not prominently warn that user text may be sent off-device when local generation fails; it also omits the --file input and ffmpeg behavior from the main capability description.
Install Mechanism
No installer, package download, persistence hook, or hidden setup script is present, but the runtime depends on local ComfyUI assets and a separate tts-cosyvoice script that are not declared as formal requirements.
Credentials
Network access is expected for ComfyUI, but COMFYUI_URL is accepted from the environment without host validation, so generated text and workflow data could be sent to a non-local endpoint if that variable is changed.
Persistence & Privilege
No autostart, privilege escalation, credential harvesting, or broad indexing was found; file mutation is limited to user output paths and copying reference audio into the ComfyUI input directory for the voice-clone flow.
如何使用
- 确保已安装 OpenClaw(本地或 Docker 部署)
- 在对话框中输入安装命令:
/install tts-qwen3 - 安装完成后,直接呼叫该 Skill 的名称或使用
/tts-qwen3触发 - 根据 Skill 的参数说明提供必要输入,即可获得结构化输出
版本历史
v1.0.0
Qwen3-TTS 本地语音合成,支持音色克隆+声音设计+6角色音色库,失败回退Edge TTS
元数据
常见问题
Qwen3-TTS Voice Synthesis 是什么?
Qwen3-TTS 本地语音合成。支持音色克隆、声音设计、多角色对话。琪琪OPC首选TTS,失败回退到 tts-cosyvoice (Edge TTS)。 它是一个面向 Claude Code / OpenClaw 的 AI Agent Skill 插件,目前累计下载 40 次。
如何安装 Qwen3-TTS Voice Synthesis?
在 OpenClaw 或 Claude Code 对话框中运行命令「/install tts-qwen3」即可一键安装,无需额外配置。
Qwen3-TTS Voice Synthesis 是免费的吗?
是的,Qwen3-TTS Voice Synthesis 完全免费,采用 MIT-0 许可证,可自由下载、安装和使用。
Qwen3-TTS Voice Synthesis 支持哪些平台?
Qwen3-TTS Voice Synthesis 跨平台运行,可在任意部署了 OpenClaw / Claude Code 的环境中使用(cross-platform)。
谁开发了 Qwen3-TTS Voice Synthesis?
由 vincentlau2046-sudo(@vincentlau2046-sudo)开发并维护,当前版本 v1.0.0。
推荐 Skills