← 返回 Skills 市场
mimo-tts-wav
作者
xcchenx345
· GitHub ↗
· v1.0.0
· MIT-0
35
总下载
0
收藏
0
当前安装
1
版本数
在 OpenClaw 中安装
/install mimo-tts-wav
功能描述
小米 MiMo-V2.5-TTS 语音合成工具。将文本合成为 WAV 音频文件,支持预置音色、语音设计、音色克隆。使用 OpenAI SDK 调用 mimo-v2.5-tts / mimo-v2.5-tts-voicedesign / mimo-v2.5-tts-voiceclone 模型。需要 MIMO_API...
使用说明 (SKILL.md)
MiMo TTS WAV 语音合成
调用小米 MiMo-V2.5-TTS 系列的 OpenAI 兼容 API,将文本合成为 WAV 音频文件。
前置条件
- 环境变量
MIMO_API_KEY已设置(从 xiaomimimo.com 获取) - Python 依赖:
openai,numpy,soundfile(如用流式)
使用方式
快速合成(非流式)
import os
from openai import OpenAI
import base64
client = OpenAI(
api_key=os.environ["MIMO_API_KEY"],
base_url="https://api.xiaomimimo.com/v1"
)
completion = client.chat.completions.create(
model="mimo-v2.5-tts",
messages=[
{"role": "user", "content": "用轻快活泼的语气读出这段文字"},
{"role": "assistant", "content": "你好,欢迎收听今天的节目。"}
],
audio={
"format": "wav",
"voice": "冰糖" # 预置音色
}
)
audio_bytes = base64.b64decode(completion.choices[0].message.audio.data)
with open("output.wav", "wb") as f:
f.write(audio_bytes)
可用模型
| Model ID | 功能 |
|---|---|
mimo-v2.5-tts |
预置音色合成(支持唱歌) |
mimo-v2.5-tts-voicedesign |
文本描述定制音色 |
mimo-v2.5-tts-voiceclone |
音频样本复刻音色 |
预置音色(mimo-v2.5-tts)
mimo_default(中国集群=冰糖,海外集群=Mia)冰糖(中文女声)茉莉(中文女声)苏打(中文男声)白桦(中文男声)Mia(英文女声)Chloe(英文女声)Milo(英文男声)Dean(英文男声)
风格控制
两种方式(二选一):
- 自然语言控制 → 写在
role: user的content中 - 音频标签控制 → 在
role: assistant的content中嵌入(风格)和[音频标签]
见 references/style-guide.md 获取详细风格标签列表。
脚本
scripts/tts_simple.py— 单次非流式合成 WAVscripts/tts_with_style.py— 带风格控制的合成示例scripts/tts_stream.py— 流式合成并拼接 WAV
运行方式:python scripts/tts_simple.py "要合成的文本"
能力标签
如何使用
- 确保已安装 OpenClaw(本地或 Docker 部署)
- 在对话框中输入安装命令:
/install mimo-tts-wav - 安装完成后,直接呼叫该 Skill 的名称或使用
/mimo-tts-wav触发 - 根据 Skill 的参数说明提供必要输入,即可获得结构化输出
版本历史
v1.0.0
- Initial release of mimo-tts-wav.
- Provides a tool for synthesizing text into WAV audio using Xiaomi MiMo-V2.5-TTS models.
- Supports preset voices, voice design by text, and voice cloning.
- Integrates with OpenAI-compatible API, requiring MIMO_API_KEY.
- Includes scripts for single synthesis, style control, and streaming synthesis.
- Suitable for generating voice-overs, audiobooks, and voice messages.
元数据
常见问题
mimo-tts-wav 是什么?
小米 MiMo-V2.5-TTS 语音合成工具。将文本合成为 WAV 音频文件,支持预置音色、语音设计、音色克隆。使用 OpenAI SDK 调用 mimo-v2.5-tts / mimo-v2.5-tts-voicedesign / mimo-v2.5-tts-voiceclone 模型。需要 MIMO_API... 它是一个面向 Claude Code / OpenClaw 的 AI Agent Skill 插件,目前累计下载 35 次。
如何安装 mimo-tts-wav?
在 OpenClaw 或 Claude Code 对话框中运行命令「/install mimo-tts-wav」即可一键安装,无需额外配置。
mimo-tts-wav 是免费的吗?
是的,mimo-tts-wav 完全免费,采用 MIT-0 许可证,可自由下载、安装和使用。
mimo-tts-wav 支持哪些平台?
mimo-tts-wav 跨平台运行,可在任意部署了 OpenClaw / Claude Code 的环境中使用(cross-platform)。
谁开发了 mimo-tts-wav?
由 xcchenx345(@xcchenx345)开发并维护,当前版本 v1.0.0。
推荐 Skills