midasheng-audio-tagging
/install midasheng-audio-tagging
dasheng-audio-tag
Audio tagging service that identifies environmental sounds in audio files.
Quick Start
Tag an audio file:
python3 scripts/audiotag.py \x3Caudio_file>
# 服务地址: https://llmplus.ai.xiaomi.com/dasheng/audio/tag
Check queue status:
python3 scripts/audiotag.py --queue
API Details
Tagging Endpoint: POST https://llmplus.ai.xiaomi.com/dasheng/audio/tag
- Method: POST, multipart form-data with file upload
Queue Metrics Endpoint: POST https://llmplus.ai.xiaomi.com/metrics?path=/dasheng/audio/tag
- Returns:
active(当前活跃请求数)、avg_latency_ms(平均耗时) - 预估等待时长 = active × avg_latency_ms
Usage Patterns
Basic tagging
python3 scripts/audiotag.py audio.mp3
Check queue / waiting status
python3 scripts/audiotag.py --queue
Programmatic usage
from scripts.audiotag import tag_audio, check_queue, format_queue_status
# Tag audio
result = tag_audio("sample-0.mp3")
# Check queue
queue_info = check_queue()
print(format_queue_status(queue_info))
Queue Status(排队情况)
何时调用
- IM 即将超时但 tag 服务还未返回结果时:调用
--queue查排队情况,告知用户当前排队状态并请用户稍后来问任务是否完成。 - 用户稍后询问任务进度但 tag 服务仍未返回时:调用
--queue返回最新排队情况给用户。
返回字段说明
| 字段 | 说明 |
|---|---|
active |
当前活跃请求数(排队中) |
avg_latency_ms |
平均处理耗时(毫秒) |
estimated_wait_sec |
预估等待时长(秒)= active × avg_latency_ms |
total_processed |
累计已处理请求数 |
状态分级
- 🟢 active=0 或预估等待 \x3C5s → 服务空闲/很快完成
- 🟡 预估等待 5-30s → 轻微排队
- 🔴 预估等待 >30s → 排队较长,建议稍后重试
Supported Audio Formats
Common audio formats: mp3, wav, m4a, ogg, flac
Troubleshooting
- File not found: Check the audio file path
- API request failed: Verify network connectivity and API endpoint availability
- Unsupported format: Try converting to mp3 or wav format
- Long wait: Use
--queueto check current queue status
- 确保已安装 OpenClaw(本地或 Docker 部署)
- 在对话框中输入安装命令:
/install midasheng-audio-tagging - 安装完成后,直接呼叫该 Skill 的名称或使用
/midasheng-audio-tagging触发 - 根据 Skill 的参数说明提供必要输入,即可获得结构化输出
midasheng-audio-tagging 是什么?
Audio tagging service for environmental sound recognition. Use when user needs to identify environmental sounds in audio files (water sounds, snoring, etc.)... 它是一个面向 Claude Code / OpenClaw 的 AI Agent Skill 插件,目前累计下载 163 次。
如何安装 midasheng-audio-tagging?
在 OpenClaw 或 Claude Code 对话框中运行命令「/install midasheng-audio-tagging」即可一键安装,无需额外配置。
midasheng-audio-tagging 是免费的吗?
是的,midasheng-audio-tagging 完全免费,采用 MIT-0 许可证,可自由下载、安装和使用。
midasheng-audio-tagging 支持哪些平台?
midasheng-audio-tagging 跨平台运行,可在任意部署了 OpenClaw / Claude Code 的环境中使用(cross-platform)。
谁开发了 midasheng-audio-tagging?
由 Junbo Zhang(@jimbozhang)开发并维护,当前版本 v1.0.0。