/install feishu-minimax-t2a-voice
feishu-voice
接收:语音 → 文字
飞书自动为语音消息生成转写,消息体中自带 Transcript 字段,直接读取即可,无需任何 API 调用。
发送:文字 → 语音
流程
Step 1. 调用脚本生成语音文件:
python scripts/reply.py "\x3C文字内容>"
输出文件路径(格式为 .opus 或 .ogg)。
Step 2. 通过飞书发送语音:
message(action=send, channel=feishu, media=\x3Cfilepath>, contentType="audio/opus")
注:Edge TTS 输出的 .ogg 文件同样使用 audio/opus contentType。
MiniMax 语气词(配置了 MINIMAX_API_KEY 时)
在生成回复文本时主动嵌入以下标记,可让语音更自然:
| 标记 | 含义 | 使用场景 |
|---|---|---|
\x3C#0.3#> |
停顿 0.3 秒 | 逗号后、句子中间 |
(breath) |
自然呼吸 | 长句中间、句末 |
(sighs) |
叹气 | 感叹、无奈时 |
(emm) |
思考语气 | 问句结尾、停顿后继续 |
(clear-throat) |
清嗓 | 转折、开始说话 |
(laughs) |
笑声 | 开心、幽默内容 |
(chuckle) |
轻笑 | 轻松调侃 |
(sniffs) |
吸鼻子 | 轻微情绪 |
(humming) |
哼唱 | 愉快、自言自语 |
规则:
- 标记插入两个有发音文本之间,不可连续叠加
- 问句句尾加
(emm) - 感叹句插
(laughs)或(sighs) - 句号前无自然停顿时加
(breath) - 长叙述每隔 20-30 字符插一次
(breath)或\x3C#0.3#>
示例:
模型生成文本:好的,那我们出发吧。
应生成:好的\x3C#0.3#>,那我们出发吧(laughs)。
模型生成文本:等等,让我想想,这个怎么做来着?
应生成:等等\x3C#0.3#>,让我想想(emm)\x3C#0.4#>,这个怎么做来着?
模型生成文本:唉,今天真是太累了。
应生成:唉(sighs),今天真是太累了(breath)。
链路降级
MiniMax T2A (mp3) → ffmpeg → opus [优先]
↓ 超时/无 key
Edge TTS (ogg 直出) [降级]
↓ 失败
返回纯文字(不走语音)
环境变量
| 变量 | 必填 | 说明 |
|---|---|---|
MINIMAX_API_KEY |
否 | 有则优先 MiniMax;无则 Edge TTS |
EDGE_TTS_VOICE |
否 | Edge TTS 音色,默认 zh-CN-XiaoxiaoNeural |
快速参考
# 生成语音并发送
python scripts/reply.py "\x3C文字>" → 输出文件路径 → message(media=路径, contentType="audio/opus")
- Make sure OpenClaw is installed (local or Docker)
- Run the install command in chat:
/install feishu-minimax-t2a-voice - After installation, invoke the skill by name or use
/feishu-minimax-t2a-voice - Provide required inputs per the skill's parameter spec and get structured output
What is feishu-minimax-t2a-voice?
飞书语音消息收发:接收语音自动转文字(飞书原生 Transcript + Whisper 降级),回复语音由 MiniMax T2A 合成后发送。 It is an AI Agent Skill for Claude Code / OpenClaw, with 123 downloads so far.
How do I install feishu-minimax-t2a-voice?
Run "/install feishu-minimax-t2a-voice" in the OpenClaw or Claude Code chat to install it in one step — no extra setup required.
Is feishu-minimax-t2a-voice free?
Yes, feishu-minimax-t2a-voice is completely free, licensed under MIT-0. You can download, install and use it at no cost.
Which platforms does feishu-minimax-t2a-voice support?
feishu-minimax-t2a-voice is cross-platform and runs anywhere OpenClaw / Claude Code is available (cross-platform).
Who created feishu-minimax-t2a-voice?
It is built and maintained by habitum (@michelangelo-in-sistine); the current version is v1.0.1.