← 返回 Skills 市场
vincentlau2046-sudo

Qwen3-TTS Voice Synthesis

作者 vincentlau2046-sudo · GitHub ↗ · v1.0.0 · MIT-0
cross-platform ⚠ suspicious
40
总下载
0
收藏
0
当前安装
1
版本数
在 OpenClaw 中安装
/install tts-qwen3
功能描述
Qwen3-TTS 本地语音合成。支持音色克隆、声音设计、多角色对话。琪琪OPC首选TTS,失败回退到 tts-cosyvoice (Edge TTS)。
使用说明 (SKILL.md)

Qwen3-TTS 本地语音合成

基于 Qwen3-TTS 1.7B 模型,支持音色克隆 + 声音设计 + 多角色对话。 琪琪OPC 首选 TTS,失败时回退到 tts-cosyvoice (Edge TTS)。

优先级

Qwen3-TTS(本地GPU,音色克隆+设计)→ Edge TTS(tts-cosyvoice,云端回退)

琪琪OPC 音色库

6 个角色音色,通过 ComfyUI API 调用:

角色 音色名 方式 说明 用途
🐰 琪琪 qiqi_clone 克隆 ref_audio=qiqi_voice_v3.wav 琪琪对话
📖 旁白 narrator_teacher VoiceDesign seed=100, 温暖女声 叙事
👦 男孩 boy_child VoiceDesign seed=200, 活泼8岁 儿童男角
👧 女孩 girl_child VoiceDesign seed=300, 甜美7岁 儿童女角
👨 大人男 adult_male VoiceDesign seed=400, 沉稳 成年男角
👩 大人女 adult_female VoiceDesign seed=500, 优雅 成年女角

脚本

单角色 TTS

python3 {baseDir}/scripts/qwen_tts.py \
  --text "你好,我是琪琪" \
  --voice qiqi_clone \
  --output /tmp/output.wav

多角色对话 TTS

python3 {baseDir}/scripts/qwen_tts_dialogue.py \
  --script "琪琪:你好呀!\
旁白:琪琪开心地笑了。" \
  --output /tmp/dialogue.wav \
  --srt /tmp/dialogue.srt

选项

选项 默认 说明
--text (必需) 要合成的文本
--voice narrator_teacher 音色名(见音色库)
--output /tmp/qwen_tts_output.wav 输出文件路径
--language Chinese 语言
--model 1.7B 模型大小 (0.6B/1.7B)
--attention sdpa 注意力机制
--fallback-edge true 失败时回退到 Edge TTS

对话脚本格式

角色名: 台词内容
角色名: 台词内容

角色名映射到音色库中的音色。旁白 映射到 narrator_teacher

依赖

  • ComfyUI 运行中(localhost:8188)
  • ComfyUI-Qwen-TTS 插件已安装
  • Qwen3-TTS 模型已下载(~/ComfyUI/models/qwen-tts/)
  • comfyui-venv Python 环境

回退策略

当 Qwen3-TTS 不可用时(ComfyUI 未启动 / GPU 显存不足 / 生成失败), 自动回退到 Edge TTS (tts-cosyvoice):

  • 琪琪 → zh-CN-XiaoyiNeural
  • 旁白 → zh-CN-XiaoxiaoNeural
  • 男孩 → zh-CN-YunxiNeural
  • 女孩 → zh-CN-XiaoyiNeural
  • 大人男 → zh-CN-YunjianNeural
  • 大人女 → zh-CN-XiaoxiaoNeural

版本: v1.0 | 琪琪OPC 首选 TTS | 基于 Qwen3-TTS + ComfyUI

安全使用建议
Install only if you are comfortable with possible off-device text processing. Keep COMFYUI_URL set to localhost or another trusted ComfyUI server, avoid sensitive text unless you disable fallback with --fallback-edge false, and review or install the referenced tts-cosyvoice dependency before relying on fallback output.
能力评估
Purpose & Capability
The ComfyUI Qwen3-TTS workflow, voice presets, audio conversion, and output writing fit the stated voice-synthesis purpose, but the documented dialogue helper is absent and the local-TTS framing is weakened by automatic fallback behavior.
Instruction Scope
SKILL.md discloses Edge TTS fallback and the fallback flag, but it does not prominently warn that user text may be sent off-device when local generation fails; it also omits the --file input and ffmpeg behavior from the main capability description.
Install Mechanism
No installer, package download, persistence hook, or hidden setup script is present, but the runtime depends on local ComfyUI assets and a separate tts-cosyvoice script that are not declared as formal requirements.
Credentials
Network access is expected for ComfyUI, but COMFYUI_URL is accepted from the environment without host validation, so generated text and workflow data could be sent to a non-local endpoint if that variable is changed.
Persistence & Privilege
No autostart, privilege escalation, credential harvesting, or broad indexing was found; file mutation is limited to user output paths and copying reference audio into the ComfyUI input directory for the voice-clone flow.
如何使用
  1. 确保已安装 OpenClaw(本地或 Docker 部署)
  2. 在对话框中输入安装命令:/install tts-qwen3
  3. 安装完成后,直接呼叫该 Skill 的名称或使用 /tts-qwen3 触发
  4. 根据 Skill 的参数说明提供必要输入,即可获得结构化输出
版本历史
v1.0.0
Qwen3-TTS 本地语音合成,支持音色克隆+声音设计+6角色音色库,失败回退Edge TTS
元数据
Slug tts-qwen3
版本 1.0.0
许可证 MIT-0
累计安装 0
当前安装数 0
历史版本数 1
常见问题

Qwen3-TTS Voice Synthesis 是什么?

Qwen3-TTS 本地语音合成。支持音色克隆、声音设计、多角色对话。琪琪OPC首选TTS,失败回退到 tts-cosyvoice (Edge TTS)。 它是一个面向 Claude Code / OpenClaw 的 AI Agent Skill 插件,目前累计下载 40 次。

如何安装 Qwen3-TTS Voice Synthesis?

在 OpenClaw 或 Claude Code 对话框中运行命令「/install tts-qwen3」即可一键安装,无需额外配置。

Qwen3-TTS Voice Synthesis 是免费的吗?

是的,Qwen3-TTS Voice Synthesis 完全免费,采用 MIT-0 许可证,可自由下载、安装和使用。

Qwen3-TTS Voice Synthesis 支持哪些平台?

Qwen3-TTS Voice Synthesis 跨平台运行,可在任意部署了 OpenClaw / Claude Code 的环境中使用(cross-platform)。

谁开发了 Qwen3-TTS Voice Synthesis?

由 vincentlau2046-sudo(@vincentlau2046-sudo)开发并维护,当前版本 v1.0.0。

💬 留言讨论