← 返回 Skills 市场
xcchenx345

mimo-tts-wav

作者 xcchenx345 · GitHub ↗ · v1.0.0 · MIT-0
cross-platform ⚠ pending
35
总下载
0
收藏
0
当前安装
1
版本数
在 OpenClaw 中安装
/install mimo-tts-wav
功能描述
小米 MiMo-V2.5-TTS 语音合成工具。将文本合成为 WAV 音频文件,支持预置音色、语音设计、音色克隆。使用 OpenAI SDK 调用 mimo-v2.5-tts / mimo-v2.5-tts-voicedesign / mimo-v2.5-tts-voiceclone 模型。需要 MIMO_API...
使用说明 (SKILL.md)

MiMo TTS WAV 语音合成

调用小米 MiMo-V2.5-TTS 系列的 OpenAI 兼容 API,将文本合成为 WAV 音频文件。

前置条件

  • 环境变量 MIMO_API_KEY 已设置(从 xiaomimimo.com 获取)
  • Python 依赖:openai, numpy, soundfile(如用流式)

使用方式

快速合成(非流式)

import os
from openai import OpenAI
import base64

client = OpenAI(
    api_key=os.environ["MIMO_API_KEY"],
    base_url="https://api.xiaomimimo.com/v1"
)

completion = client.chat.completions.create(
    model="mimo-v2.5-tts",
    messages=[
        {"role": "user", "content": "用轻快活泼的语气读出这段文字"},
        {"role": "assistant", "content": "你好,欢迎收听今天的节目。"}
    ],
    audio={
        "format": "wav",
        "voice": "冰糖"  # 预置音色
    }
)

audio_bytes = base64.b64decode(completion.choices[0].message.audio.data)
with open("output.wav", "wb") as f:
    f.write(audio_bytes)

可用模型

Model ID 功能
mimo-v2.5-tts 预置音色合成(支持唱歌)
mimo-v2.5-tts-voicedesign 文本描述定制音色
mimo-v2.5-tts-voiceclone 音频样本复刻音色

预置音色(mimo-v2.5-tts)

  • mimo_default(中国集群=冰糖,海外集群=Mia)
  • 冰糖(中文女声)
  • 茉莉(中文女声)
  • 苏打(中文男声)
  • 白桦(中文男声)
  • Mia(英文女声)
  • Chloe(英文女声)
  • Milo(英文男声)
  • Dean(英文男声)

风格控制

两种方式(二选一):

  1. 自然语言控制 → 写在 role: usercontent
  2. 音频标签控制 → 在 role: assistantcontent 中嵌入 (风格)[音频标签]

references/style-guide.md 获取详细风格标签列表。

脚本

  • scripts/tts_simple.py — 单次非流式合成 WAV
  • scripts/tts_with_style.py — 带风格控制的合成示例
  • scripts/tts_stream.py — 流式合成并拼接 WAV

运行方式:python scripts/tts_simple.py "要合成的文本"

能力标签
requires-sensitive-credentials
如何使用
  1. 确保已安装 OpenClaw(本地或 Docker 部署)
  2. 在对话框中输入安装命令:/install mimo-tts-wav
  3. 安装完成后,直接呼叫该 Skill 的名称或使用 /mimo-tts-wav 触发
  4. 根据 Skill 的参数说明提供必要输入,即可获得结构化输出
版本历史
v1.0.0
- Initial release of mimo-tts-wav. - Provides a tool for synthesizing text into WAV audio using Xiaomi MiMo-V2.5-TTS models. - Supports preset voices, voice design by text, and voice cloning. - Integrates with OpenAI-compatible API, requiring MIMO_API_KEY. - Includes scripts for single synthesis, style control, and streaming synthesis. - Suitable for generating voice-overs, audiobooks, and voice messages.
元数据
Slug mimo-tts-wav
版本 1.0.0
许可证 MIT-0
累计安装 0
当前安装数 0
历史版本数 1
常见问题

mimo-tts-wav 是什么?

小米 MiMo-V2.5-TTS 语音合成工具。将文本合成为 WAV 音频文件,支持预置音色、语音设计、音色克隆。使用 OpenAI SDK 调用 mimo-v2.5-tts / mimo-v2.5-tts-voicedesign / mimo-v2.5-tts-voiceclone 模型。需要 MIMO_API... 它是一个面向 Claude Code / OpenClaw 的 AI Agent Skill 插件,目前累计下载 35 次。

如何安装 mimo-tts-wav?

在 OpenClaw 或 Claude Code 对话框中运行命令「/install mimo-tts-wav」即可一键安装,无需额外配置。

mimo-tts-wav 是免费的吗?

是的,mimo-tts-wav 完全免费,采用 MIT-0 许可证,可自由下载、安装和使用。

mimo-tts-wav 支持哪些平台?

mimo-tts-wav 跨平台运行,可在任意部署了 OpenClaw / Claude Code 的环境中使用(cross-platform)。

谁开发了 mimo-tts-wav?

由 xcchenx345(@xcchenx345)开发并维护,当前版本 v1.0.0。

💬 留言讨论