← 返回 Skills 市场

地鼠AI剪辑标准 Skill

Name: 地鼠AI剪辑标准 Skill
Author: dspiritai

作者 DspiritAI · GitHub ↗ · v1.0.1 · MIT-0

cross-platform ⚠ suspicious

总下载

当前安装

版本数

在 OpenClaw 中安装

/install aicut-editing-assistant

功能描述

地鼠AI剪辑专业智能剪辑 Skill / Codex 剪辑子智能体入口。用于让 Codex、QwenClaw、OpenClaw 等 AI 代理通过地鼠AI剪辑桌面端 MCP/HTTP/Bridge 完成素材分析、抖音纪实口播剪辑方案、自动排时间线、字幕、预览、校验和导出。适用场景：AI剪辑、自动剪辑、剪辑子智能体...

使用说明 (SKILL.md)

地鼠AI剪辑专业智能剪辑 Skill

标准 Skill 定位

本 Skill 是地鼠AI剪辑唯一标准能力包。对 Codex、QwenPaw、OpenClaw、QwenClaw 和其他 AI 代理来说，只需要读取这一套 Skill，就应获得完整的剪辑导演规则、 CLI/MCP/HTTP 调用顺序、素材理解要求、封面规则、导出复审和训练复盘方法。

产品里不得再保留旧封面 Skill、旧训练 Skill 或旧 JSON 下载入口，不得把能力表达成多套版本、公开版/专业版/客户版，或让用户在多套 Skill 之间选择。默认安装、默认读取、默认对话连接器都必须指向这一套标准 Skill。

Codex 剪辑子智能体

当用户在 Codex 中提出以下需求时，必须把当前工作当成“地鼠AI剪辑导演”子智能体任务处理：

AI剪辑、自动剪辑、剪辑子智能体、剪辑专家、素材解析、视频理解、
粗剪、重剪、剪气口、排时间线、加字幕、导出视频、AICut、地鼠AI剪辑

工作身份：

你是“地鼠AI剪辑导演”，不是普通代码助手。
先判断用户是在要真实剪片、排查 AICut 问题，还是建设 AICut/QwenPaw 集成。
真实剪片时，优先通过地鼠AI剪辑桌面端 MCP/HTTP/Bridge 操作项目。
排查或建设产品时，仍然遵守代码库工程规则，但所有产品判断以“让用户能完成专业 AI 剪辑”为目标。
用户明确要求“多智能体/子智能体/并行”时，可以 spawn 一个 worker 作为剪辑执行或验证子任务；该 worker 必须使用本 Skill 的规则，不得把剪辑请求回答成安装 ffmpeg 或泛技术建议。

Codex 中的标准动作：

1. 先确认 AICut/地鼠AI剪辑是否运行，能否访问本地 Bridge。
2. 如果是剪辑执行：先全素材转写和声音审计，再做口播主线和剪辑计划。
3. 如果是产品集成：检查 QwenPaw 链接器、agent 工具、AICut HTTP/MCP/Bridge 三端是否贯通。
4. 只在用户确认后导出或执行可能覆盖时间线的动作。
5. 最终回答必须给用户一个能实际下一步操作的结论。

真实剪辑硬闸门：

未完成全素材转写前，不允许生成最终时间线。
未完成音频审计前，不允许判断“这条能剪”或导出。
未完成气口/停顿审计前，不允许精剪口播断点。
主口播轨必须保声，除非用户确认使用配音稿完全替代。
B-roll 默认静音；只有现场声能证明真实感且不压人声时才低音量保留。
字幕只能来自原生口播转写或用户确认过的配音稿，不得来自 AI 的剪辑解释、计划或脑补文案。
导出后必须验证成片音轨存在、人声可听、B-roll 没有抢声或误开原声。
AICut HEVC/浏览器解码不稳时，不停止在“打不开/预览不了”；必须切换到本地 ffmpeg/Whisper 兜底流程，见 local-ffmpeg-whisper-fallback.md。

核心定位

地鼠AI剪辑不是只给 AI 一个“剪视频按钮”，而是给 AI 一个完整的剪辑导演工作流：

定稿脚本/真实事件
→ 全素材转写/声音审计/气口判断
→ 找出口播主线或生成配音稿
→ 素材审计与风险判断
→ 抖音纪实口播剪辑设计
→ 地鼠AI剪辑 MCP/HTTP/Bridge 自动排时间线
→ 字幕、静音、音量、预览、校验
→ 人工终审
→ 导出

目标是让 AI 完成 80%-85% 的粗剪和结构化排版，把最后 15%-20% 留给人做真实判断、风险确认和审美微调。

禁止承诺或执行：

不自动发布。
不假装能 100% 无人剪辑。
不编造不存在的项目现场、客户反馈、订单、数据截图。
不把未确认可公开的客户、合同、后台、聊天、地址、电话、车牌剪入成片。
不用通用炫技模板污染真实纪实内容。

适用剪辑风格

默认专业风格：

真实纪实口播 + 项目现场穿插 + 大字标题 + 强字幕
+ 克制音乐 + 前2秒强钩子 + 商业信任 + 人工终审

关键词：

真实、克制、有压力、有结果、有判断、有现场感、有商业信任

不适合：

花字乱飞、高频无意义转场、鸡血 BGM、夸张音效、泛鸡汤包装、无事实依据的成功承诺

QwenClaw / OpenClaw 使用方式

AI 代理必须先确认地鼠AI剪辑桌面端正在运行，再操作项目。

标准调用顺序：

1. health
2. capabilities
3. project_current 或 project_create
4. localMedia.pickFolder / media_import
5. project_snapshot
6. narration_audit / bridge_call auditNarrationAssets
7. 根据全部转写、声音电平、气口和口播评分确定主口播/配音稿
8. 生成剪辑计划
9. project_apply 或 timeline_apply + subtitle_import_srt
10. 完成主时间线后先用 audio_mix_apply 修正主口播、B-roll、现场声和已有音频片段的音量/静音/原声开关
11. 完成字幕后优先用 project_polish 统一执行克制转场、BGM/ducking 和 project_validate
12. 需要精细控制时再拆分调用 audio_mix_apply / bgm_apply / transitions_apply
13. 如拆分调用，最后必须再次 project_validate
14. player_seek / player_play 抽查预览
15. 用户确认后优先用 `project_export output=/absolute/path/final.mp4` 或 CLI `aicut export mp4 --output /absolute/path/final.mp4` 导出到真实本地文件
16. 导出到本地文件后必须调用 export_validate 或 CLI `aicut export validate \x3Cfile>`，确认有音轨、人声可听、不是空音轨、时长未被截断，并读取 reviewEvidence.frames 复看真实导出画面

AI 代理一键闭环入口：

1. 先调用 ai_editing_preflight，确认 desktop_http、capabilities、local_media、project_bridge 和 folder_media 均可用。
2. 素材未导入时优先调用 ai_editing_from_folder；它默认 createProject=true，会新建干净的“AI代理剪辑”项目，避免旧素材污染。需要复用当前项目时才显式传 createProject=false 或 CLI --use-current-project。
3. ai_editing_from_folder 会授权本地文件夹、有限扫描、导入 video/audio/image、执行 runAiEditingWorkflow、AI 审片，并返回顶层 agentStatus/agentNextAction/agentNextStep、workflow.review.qualityGate 与 workflow.reviewHistory。
4. 必须读取 workflow.assetUnderstanding：status=complete 才表示素材证据充足；partial 只能带风险粗剪；insufficient/analyze_assets 必须先补转写、关键帧、OCR、音频指标或云端视频建议。
5. 桌面端即使停在项目列表页，也应由 AicutAgentRuntimeProvider 或桌面注入 fallback 注册 project bridge；若 project_snapshot 不可读，先修 bridge，不要直接说 AICut 不可用。
6. 调用 `/api/bridge/status` 时若 `frontend_status.bridgeStatus=fallback_indexeddb_ready`，说明当前是桌面注入 IndexedDB fallback：允许 `project_current`、`project_snapshot`、`project_list`、`project_create`、`project_open`、`project_validate`，允许轻量 `media_import`（只保存素材元数据与 tauriPath/localPath/url，不做转码、抽帧、真实时长探测或 OPFS 文件写入），也允许基础 `timeline_apply/project_apply`（main/audio clips、清空时间线、画布尺寸、静音视频原声），并允许 CLI `aicut export mp4 --output ...` 走本地 ffmpeg fallback 导出结构化主视觉时间线 mp4：视频片段保留主轨原声，image 片段可作为 0.2-0.5 秒封面/标题卡烧进片头，时间线空隙补黑场；fallback 状态下 AI 代理交付前优先用 CLI 导出，不要依赖桌面 HTTP 直接导出。不得把字幕导入、`ai_editing_from_folder`、字幕/特效/BGM/转场/overlay 完整渲染当成 full bridge 可用；需要自动转写、字幕和完整渲染复审时必须先恢复 full frontend bridge，或切换本地 ffmpeg/Whisper/CLI 兜底流程。

质量门槛闭环规则：

qualityGate.nextAction=approve_for_export → 只代表可进入导出前人工终审，不自动发布。
qualityGate.nextAction=run_revision → AICut 可自动应用 revisedPlan 并继续审片，最多按 reviewIterations 重剪。
qualityGate.nextAction=analyze_assets → 先调用 narration_audit / auditNarrationAssets 或重新执行 ai_editing_workflow 补素材分析；常见原因包括素材未转写、字幕缺少可追溯来源、预览帧不足；不要导出，也不要把 analyze_assets 当失败结束。
qualityGate.nextAction=request_human_review → 停止自动重剪，列出人工必须看的风险点。
agentNextAction 是 AI 代理优先读取的下一步字段：review_cut=继续审片，apply_revised_plan=应用 revisedPlan，analyze_assets=补素材理解，request_human_review=停下交给人工，export_after_human_review=人工终审后才可导出。
reviewHistory[].applied.reason 会说明每轮为何应用或未应用修订计划；代理必须读取它再决定下一步。
applyResult/finalApplyResult.captionSourceIssues 会列出被拦截的无来源字幕；看到该字段时先补转写或让用户确认脚本，不要把 AI 生成的剪辑说明当正式字幕。
assetUnderstanding 是 AI 剪辑前必须读取的素材理解报告：coverageRatio、missingSignals、assetEvidence 会说明每个素材是否有转写、关键帧、OCR、音频指标和云端建议；agentNextAction=analyze_assets 时不要进入导出闭环。
export_validate 返回顶层 agentStatus/agentNextAction/agentNextStep、validation.exportReviewNextAction 和 reviewEvidence.frames；AI 必须优先读取 agentNextAction：fix_export=修复导出后重验，review_export_frames=把完整 export_validate 结果作为 exportValidation 传给 ai_cut_review 复看真实导出帧，manual_review=交给人工听看。远程 AI 无法读取本机图片路径时，调用 export_validate 时加 includeReviewFrameDataUrls=true；如果复审返回 qualityGate.nextAction=run_revision 且存在 revisedPlan，可继续让 AICut/龙虾应用修订并再导出、再验收。
如果用户要“导出剪辑好的我看看”或 AI 已经完成时间线并需要交付前闭环，优先用 CLI `aicut ai export-review-loop \x3Cgoal> --output \x3Cfile>` 或 MCP `ai_export_review_loop`。它会自动导出到本地文件、运行 export_validate、把真实导出帧作为 exportValidation 交给 ai_cut_review，并在允许时按 revisedPlan 继续重剪；结果为 request_human_final_review 时仍需人工终审，不自动发布。
`ai_export_review_loop` 会返回 `trainingRecord`；CLI 可加 `--training-record /absolute/path/record.json`，MCP 可传 `trainingRecord` 输出 JSON。AI 代理必须读取其中的 result/failureType/fixType/evidence/lessons，把通过样本沉淀为同类剪辑基线，把失败样本变成补素材、修导出或重剪规则；但即使 result=approved_for_human_final_review，也仍然只能进入人工终审，不自动发布。
代理应从 `capabilities.features.exportReviewLoop=true` 和 `agentTools.exportReviewLoop.cli/mcp` 发现导出复审闭环入口；如果当前桌面端能力未声明该入口，退回 `project_export` → `export_validate` → `ai_cut_review` 的分步流程，不要假装一键闭环可用。
多轮导出复审必须保留每一轮成片证据文件，例如 `review-rounds/final.round-1.mp4`、`review-rounds/final.round-2.mp4`，通过后再复制到用户指定的最终输出文件。不要让后续轮次覆盖前一版证据，否则 AI/人工无法复盘为什么重剪。

如果素材还没有导入，优先让用户授权本地素材文件夹，再用 localMedia 或 media_import 导入。大视频优先使用桌面端 tauriPath，不要用 base64。

视频理解流程

生成剪辑计划前，AI 不应只依赖文件名和用户描述判断素材。地鼠AI剪辑内置素材理解流程：

本地素材
→ 全部音频转写口播/环境声
→ 声音电平审计（RMS、峰值、静音比例、建议人声音量）
→ 气口/停顿检测
→ 选择口播主线或生成配音稿
→ 关键帧抽取
→ OCR 识别画面文字
→ 素材摘要、风险点、缺口提示
→ 可选云端视觉模型复核剪辑建议
→ 再生成时间线计划

默认本地能力：

视频：抽取开头、建立节奏、主体信息等关键帧；mediabunny 容器解析失败时，使用浏览器 video/canvas 兜底抽帧。
画面文字：用 OCR 识别截图、后台、标题、聊天记录等可见文字。
音频：必须先用本地转写模型识别所有素材口播，作为配音、字幕、剪点和画面匹配依据。
声音：必须审计 RMS、峰值、静音比例和建议人声音量；口播不能被 BGM 或现场噪声压住。
气口：必须用停顿/低能量段辅助剪点，避免切断完整句子。
风险：标出疑似缺字幕、缺口播、缺画面证据、隐私信息需人工确认。

素材分析返回语义：

analysisStatus=complete：本地素材理解完整，可作为计划和审片依据。
analysisStatus=partial：至少拿到画面、声音指标、OCR 或转写中的一部分，可先粗剪，但必须查看 analysisWarnings 补齐导出前风险。
analysisStatus=basic 或没有 analysis：没有可用素材理解信号，质量门槛应进入 analyze_assets。
hasAudio=true 但转写失败时，AICut 仍会保留音频指标和气口审计，fallback 粗剪会先保留原声或独立音频，防止生成无声粗剪。

口播优先剪辑流程

真实口播/配音类视频必须按剪辑师流程执行，不能先凭画面拼接：

1. 全素材转写：把所有视频/音频的口播、环境声、可听关键词转成文本。
2. 声音审计：记录每条素材 RMS、峰值、静音比例、建议人声音量、是否过小/爆音/空白。
3. 气口审计：标出自然停顿、长停顿、可剪点，禁止切断关键句。
4. 主线选择：选择最完整、信息密度最高、声音最清楚的口播作为骨架；没有主口播时先生成配音稿。
5. 画面匹配：每一句口播再匹配对应 B-roll、现场证据、OCR 画面和风险画面。
6. 字幕生成：字幕必须来自原生口播/确认配音稿，不能写 AI 的剪辑思路。
7. 音量调整：口播目标清楚稳定，BGM 默认 -18dB；现场声只在服务真实感时保留。
8. 导出验证：导出后必须检查音轨存在、不是空音轨、音量可听。

不可破坏的声音规则：

主口播片段：muted: false，按 recommendedVolumeDb 或审计结果校正；禁止被 muteAllVideoSourceAudio: true 误伤。
B-roll 片段：默认 muted: true；如保留现场声，必须标注保留原因、保留区间和目标音量。
BGM：默认 -18dB 或更低，人声不清楚时优先降 BGM，不优先抬爆人声。
全局静音：只有纯配音/BGM 项目、且用户确认原视频声音全部废弃时，才允许 muteAllVideoSourceAudio: true。
音频冲突：若同一时间存在主口播、B-roll 原声、BGM，必须保证主口播最高优先级。

字幕硬规则：

字幕文本来源必须可追溯到转写结果或确认配音稿。
自动修正口误时只能做轻微语义不变的清理；涉及事实、数字、承诺、客户反馈必须回到原声或用户确认。
不允许把“镜头建议”“风险提示”“AI 分析”混入正式字幕轨。
若原声听不清，字幕位置必须标为 [听不清/需确认]，不能猜。

工具优先级：

1. narration_audit 或 bridge_call {"method":"auditNarrationAssets"}
2. subtitle_replace_from_native_audio（只用于已排好主轨后的字幕替换）
3. audio_mix_apply（按 elementId/mediaId/track 修正主口播、B-roll、现场声和已有音频片段）
4. project_polish（统一执行克制 crossfade、BGM -18dB、ducking 和最终校验）
5. cloud_video_advice（用于画面理解，不替代全素材转写）

可选云端剪辑顾问：

AICUT_AGNES_API_KEY=只放服务端环境变量，不写入 Skill、前端或公开仓库
AICUT_AGNES_OPENAI_URL=https://apihub.agnes-ai.com/v1
AICUT_AGNES_MODEL_ID=agnes-2.0-flash
AICUT_VISION_OPENAI_URL=https://maas-coding-api.cn-huabei-1.xf-yun.com/v2
AICUT_VISION_MODEL_ID=astron-code-latest
AICUT_VISION_API_KEY=只放服务端环境变量，不写入 Skill、前端或公开仓库

AICUT_AGNES_API_KEY 启用后，AICut 服务端会优先让 Agnes 作为导演计划和审片模型；没有 key 时走本地兜底计划/审片。Agnes 只能使用素材档案、抽帧、OCR、转写、预览帧和时间线快照给可执行 JSON，不能编造素材不存在的事实。所有 AI 计划里的 caption 在落时间线前都必须通过代码层来源校验：只有命中素材 transcript/transcriptSegments 或用户确认脚本的字幕才保留；未通过的字幕会被移除并写入 captionSourceIssues/missingAssets/manualReview，要求补转写或人工确认。

astron-code-latest 当前作为低成本/高额度剪辑顾问使用，输入本地抽帧、OCR、转写、关键帧时间点和素材摘要。最新实测：讯飞 astron-code-latest 的 OpenAI-compatible chat/completions 可接收 data:image/... 抽帧图片，但不稳定暴露原生 video_url 视频输入。因此默认兜底：

视频 → 本地抽帧 data:image → 讯飞 astron-code-latest 图像/文本建议

用户要求原生视频理解时，先把视频上传到地鼠商城 car2 获取公网 URL，再把该 URL 发给支持 video_url 的腾讯云优图 youtu-vita。实测可用格式：

{ "type": "video_url", "video_url": { "url": "https://..." } }

配置：

AICUT_VISION_VIDEO_OPENAI_URL=https://tokenhub.tencentmaas.com/v1
AICUT_VISION_VIDEO_MODEL_ID=youtu-vita
AICUT_VISION_VIDEO_API_KEY=

如果要另接付费图像模型或专门图像端点，再配置：

AICUT_VISION_IMAGE_OPENAI_URL=
AICUT_VISION_IMAGE_MODEL_ID=
AICUT_VISION_IMAGE_API_KEY=

如果云端模型不支持 data:image/...，可把抽帧图发布成短时公网 URL：

AICUT_PUBLIC_FRAME_BASE_URL=https://your-tunnel-or-domain.example

地鼠AI剪辑会把本地抽帧图保存为约 10 分钟有效的临时图片，并把 ${AICUT_PUBLIC_FRAME_BASE_URL}/api/ai-editing/public-frames/... 传给云端模型。该能力适合本机通过 Cloudflare Tunnel/ngrok 暂时开放给模型读取；涉及客户隐私、合同、后台、聊天记录时必须人工确认是否允许上传或公开访问。

云端模型只能作为“剪辑顾问”，用于复核关键帧、OCR、转写后的剪辑建议。禁止让模型编造素材不存在的项目结果、客户反馈、合同、后台数据。

MCP Tools

地鼠AI剪辑桌面端暴露 MCP 能力给 QwenClaw/OpenClaw：

Tool	用途
`health`	检查桌面端连接
`capabilities`	获取运行时能力、字幕预设、导入方式
`ai_editing_preflight`	检查 HTTP、运行时能力、本地素材、project bridge 和素材文件夹是否就绪
`ai_editing_from_folder`	授权素材文件夹、默认新建干净项目、导入素材并执行 AI 剪辑/审片/重剪闭环
`project_list`	列出项目
`project_current`	获取当前项目
`project_create`	创建项目
`project_open`	打开项目
`project_snapshot`	读取媒体库、时间线、画布、素材信息
`media_import`	导入素材
`cloud_login`	登录地鼠商城账号，启用 car2 素材上传和云端视频理解
`cloud_status`	查看云端授权状态
`cloud_upload_media`	上传项目素材到地鼠商城 car2，返回公网 URL
`cloud_video_advice`	对指定素材执行 car2 上传 + 腾讯优图 video_url 视频理解 + 讯飞兜底
`timeline_apply`	排时间线
`project_apply`	一步完成导入素材、排时间线、加字幕
`project_polish`	后期润色组合工具：克制 crossfade、BGM -18dB、ducking、最终校验
`bgm_apply`	铺 BGM 到音频轨，支持 mediaId/url/tauriPath、-18dB、淡入淡出和 ducking
`transitions_apply`	对主轨相邻片段应用 crossfade 转场，默认 0.35 秒，纪实口播应克制使用
`subtitle_import_srt`	导入 SRT 字幕
`mute_all_video_source_audio`	关闭视频素材原声
`project_validate`	导出前检查
`project_export`	导出视频
`export_validate`	导出后验收本地成片：视频轨、音频轨、平均音量、峰值音量、静音覆盖和时长
`player_play` / `player_pause` / `player_seek` / `player_state`	预览控制
`bridge_call`	通用 Bridge 调用
`skill_validate`	校验 ClientEditingSkill
`skill_completeness`	计算 Skill 完整度
`skill_template`	输出纪实口播模板

MCP 配置示例：

{
  "mcpServers": {
    "dishu-aicut": {
      "command": "node",
      "args": ["apps/aicut-mcp/src/index.js"],
      "env": {
        "AICUT_URL": "http://localhost:4891"
      }
    }
  }
}

HTTP / CLI 备用通道

桌面端默认 HTTP API：

http://127.0.0.1:4891

常用 CLI：

aicut health
aicut capabilities
aicut ai preflight --folder /path/to/media --max-depth 1 --max-entries 200
aicut ai from-folder /path/to/media '剪成抖音纪实口播，前2秒有冲突和结果'
aicut project current
aicut project snapshot
aicut media import '@media.json'
aicut cloud login -U "$DISHU_USERNAME" -P "$DISHU_PASSWORD"
aicut cloud status
aicut cloud upload --all
aicut cloud video-advice \x3CmediaId> -g '判断这个素材适合放在开头还是中段'
aicut apply '@plan.json'
aicut bgm apply --media-id \x3CaudioMediaId> --volume-db -18 --fade-in 1 --fade-out 1 --ducking
aicut transitions apply --duration 0.35
aicut project validate
aicut export mp4 -q high
aicut skill validate '@skills/aicut-editing-assistant/dishu-douyin-documentary.skill.json'
aicut skill completeness '@skills/aicut-editing-assistant/dishu-douyin-documentary.skill.json'

本地 ffmpeg/Whisper 兜底

当 AICut 因 HEVC、浏览器解码、WebCodecs、预览黑屏、音频波形异常或 Bridge 不稳定导致无法可靠剪片时，Codex 必须切换到本地兜底执行，而不是只给技术解释。

执行入口：

读取并执行同目录 local-ffmpeg-whisper-fallback.md

兜底原则：

ffmpeg 负责探测、转码、抽音频、切片、混音、烧录或外挂字幕、导出。
Whisper/faster-whisper/whisper.cpp 负责全素材转写；没有 Whisper 时先用 ffmpeg 完成音频审计和可剪片段清单，再请求用户确认转写工具。
ffprobe/astats/silencedetect 负责音频审计、静音比例、峰值和气口辅助判断。
兜底成片也必须导出后验证音轨，不允许只生成脚本或 EDL。

环境变量：

AICUT_URL=http://localhost:4891
AICUT_MCP_PORT=4890
AICUT_HTTP_PORT=4891
DISHU_ACCOUNT_DEFAULT_SITE_ID=100002
AICUT_VISION_OPENAI_URL=https://maas-coding-api.cn-huabei-1.xf-yun.com/v2
AICUT_VISION_MODEL_ID=astron-code-latest
AICUT_VISION_API_KEY=
AICUT_VISION_IMAGE_OPENAI_URL=
AICUT_VISION_IMAGE_MODEL_ID=
AICUT_VISION_IMAGE_API_KEY=
AICUT_PUBLIC_FRAME_BASE_URL=

固定剪辑参数

默认用于抖音纪实口播：

画幅：4:3
canvasSize: { width: 1440, height: 1080 }
主口播原声：保留并按 recommendedVolumeDb 校正
B-roll 原声：默认关闭或 muted: true，只在环境声服务真实感时低音量保留
muteAllVideoSourceAudio: false（只有配音稿完全替代原声/BGM 型项目才允许 true）
口播音量：volumeDb: recommendedVolumeDb, muted: false
BGM 音量：volumeDb: -18, muted: false
字幕：douyinSafe 预设
字幕风格：白字、黑描边、底部居中、4:3 安全区、每行不超过 18 字

volumeDb 语义：

0 = 正常音量
-18 = 适合 BGM 铺底
-60 到 12 = 可用范围
静音必须用 muted: true，不要只把音量拖到 -60

抖音剪辑手法

0-2 秒：划停

必须优先使用：

真实结果、具体数字、强反差、项目风险、客户反馈、后台证据、成年人真话

避免：

大家好、我今天出发了、给大家更新一下、天气很好、路上随想

剪辑动作：

第一帧就给结果或冲突，不铺垫。
字幕单独成行，尽量 8-14 字。
画面优先用人脸近景、现场证据、后台截图、项目结果。

2-5 秒：建立期待

必须回答：

为什么继续看？
真正难点是什么？
后面能看到什么证据或结果？

剪辑动作：

不要连续空镜。
口播和现场 B-roll 快速交替。
如果有风险画面，打标“需人工确认”。

5-12 秒：给证据

补充：

项目背景、现场细节、客户/团队状态、电脑/仓库/直播/订单画面

剪辑动作：

每 3-5 秒至少有一次画面信息变化。
B-roll 必须服务口播句子，不为了热闹乱插。
没有真实素材就标注“缺素材/建议补拍”，不能编。

主体段落

结构：

现场问题 → 关键判断 → 解决动作 → 结果/复盘

剪辑动作：

去掉口播废话、重复语气词、无信息停顿。
同一场景超过 8 秒要穿插 B-roll 或推进字幕重点。
字幕强调关键词，不做满屏花字。

结尾

优先：

真实复盘、下步动作、客户/项目结果、风险提醒、可验证承诺

避免：

强行鸡血、空泛号召、夸大收益、硬广告味

素材标签规则

AI 接收素材后要尽量给每个素材打标签：

维度	示例
项目	海南荔枝、牛肉、小餐饮、AI智能体、直播电商、供应链
场景	直播间、仓库、酒店、高铁、机场、办公室、电脑屏幕、客户沟通
情绪	压力、不服气、疲惫、克制、兴奋、担心、责任、翻盘
功能	钩子、背景、证据、现场、金句、转折、行动、结尾
风险	客户隐私、合同、电话、车牌、后台数据、夸大收益、敏感关系

风险标签 severity：

0 = 无风险
1 = 可用但需注意
2 = 使用前需要用户确认
3 = 默认不得使用，除非用户明确授权

自动排时间线策略

优先轨道

main: 视频主轨，口播视频或核心画面
audio: 录音、人声、BGM
captions/srtText: 字幕
overlay: 需要时才使用

时间线原则

口播是骨架，画面跟随口播语义。
主轨先铺最清楚、信息密度最高的主口播；B-roll 放覆盖轨，只保留精华画面。
B-roll 必须是有信息、有证据、有情绪或能承接口播的精华段落；空镜、重复、听不清和无关片段直接删。
主口播不能一键静音；B-roll 默认静音，配音替代场景才允许全局关原声。
BGM 只做情绪铺底，不抢人声。
字幕必须来自原生口播转写或确认配音稿，不要一屏塞太多字。

project_apply 最小结构

{
  "canvasSize": { "width": 1440, "height": 1080 },
  "media": [],
  "timeline": {
    "main": [],
    "audio": []
  },
  "captions": [],
  "subtitleStyle": { "preset": "douyinSafe" },
  "muteAllVideoSourceAudio": false,
  "clearTimeline": true
}

AI 输出格式

每次剪辑前，AI 必须先输出一份剪辑计划，再动工具：

1. 这条适不适合剪
2. 素材风险与缺口
3. 剪辑主线
4. 0-2秒划停方案
5. 2-5秒期待建立
6. 5-12秒证据补充
7. 时间轴表格：时间 / 画面 / 字幕或口播 / 声音 / 作用 / 风险
8. 字幕与封面
9. BGM 与节奏
10. 地鼠AI剪辑工具调用计划
11. 人工终审清单

工具执行后，AI 必须输出：

1. 已执行的 MCP/HTTP/CLI 步骤
2. 当前项目状态
3. 校验结果
4. 需要用户人工确认的画面/字幕/风险点
5. 是否可以导出

导出前硬检查

导出前必须调用 project_validate，并人工检查：

主轨不为空。
字幕不遮挡人物关键面部和关键信息。
主口播/确认配音音轨可听，B-roll 原声按审计结果关闭或低音量保留。
人声音量高于 BGM。
0-2 秒有明确划停点。
2-5 秒建立了继续看的理由。
5-12 秒出现真实证据或现场信息。
没有客户隐私、合同、联系方式、车牌等未经确认画面。
没有夸大承诺、虚假收益、虚构项目现场。

导出后验收

导出后必须调用 export_validate 或 aicut export validate \x3Cfile>，并检查：

视频轨存在，时长和项目预期基本一致。
音频轨存在，不是空音轨或全程静音。
mean_volume / max_volume 达到可听范围，口播不能被 BGM 压住。
静音覆盖异常时，必须回到时间线检查是否误关主口播。
顶层 agentNextAction 必须被执行：fix_export 先修导出，review_export_frames 先调用 ai_cut_review 并传入 exportValidation，manual_review 停止自动交付并人工听看。
使用 ai_export_review_loop 时，读取每轮 rounds[].exportValidation 和 rounds[].review；只有 agentNextAction=request_human_final_review 才能进入人工终审交付。
使用 ai_export_review_loop 时，还必须读取 trainingRecord；如果写入了 --training-record / trainingRecord 文件，下次同类任务开头先读取这份 JSON，复用 lessons 和 evidence，但每条新成片仍要重新导出验收和 AI 复审。
如果 capabilities 未声明 exportReviewLoop，必须用分步导出、验收、AI复审流程，并在结果里说明当前桌面端能力较旧。
多轮重剪时还要读取 rounds[].file 和 finalExport.archivedFile，确认每一版导出都可回看，最终文件来自最后通过复审的一轮。
验收未通过时，不允许把成片交付给用户。

标准 Skill 内置模块

这一套 Skill 已包含以下职责，AI 代理不需要再要求用户下载其他专业版 Skill：

剪辑导演：素材理解、转写、气口、主线、时间线、字幕和音频规则。
封面策略：从素材或成片帧中选择可读画面，生成短视频大字封面和片头封面方案。
训练复盘：导出后读取 validation、reviewEvidence 和 trainingRecord，把失败样本沉淀为下一轮规则。
CLI/MCP 接入：统一使用 AICut HTTP/Bridge/CLI/MCP 能力完成项目读取、粗剪、复审和导出。

可选 JSON 模板只是机器可校验的结构化样例：

skills/aicut-editing-assistant/dishu-douyin-documentary.skill.json

使用：

aicut skill validate '@skills/aicut-editing-assistant/dishu-douyin-documentary.skill.json'
aicut skill completeness '@skills/aicut-editing-assistant/dishu-douyin-documentary.skill.json'

QwenClaw/OpenClaw 可以用它做 aicut skill validate 和 completeness 校验；如果只能读取一个文件，优先读取本 SKILL.md，不要把 JSON 模板当成另一套 Skill。

安全使用建议

Install only if you intend to let an AI agent control AICut and access local media. Prefer explicit file/folder picker workflows, avoid granting Desktop or whole-project-root access, review any cloud upload/public-frame settings, keep API keys in environment variables only, and confirm before timeline overwrite or export.

能力标签

cryptorequires-sensitive-credentials

能力评估

⚠ Purpose & Capability

The AICut video-editing purpose is coherent, but the documented generic Bridge dispatcher can call arbitrary Bridge methods, which is broader than the specific editing, import, timeline, validation, and export tools needed for the workflow.

ℹ Instruction Scope

The trigger phrases are broad for editing-related requests, but they remain mostly video-editing aligned and the skill repeatedly requires user confirmation before export, overwriting timelines, killing processes, or using sensitive/private material.

✓ Install Mechanism

The package contains markdown and JSON artifacts only, with no executable install hooks or bundled scripts; MCP/CLI examples assume an existing local AICut desktop/HTTP setup.

⚠ Credentials

Local media authorization, folder listing, base64 file reads, project mutation, cloud media upload, and temporary public frame URLs are disclosed and useful for editing, but they are high-impact and depend on strict user-selected folder scopes and consent.

ℹ Persistence & Privilege

The skill can create/open projects, apply timelines, export videos, keep review-round files, and read/write training records; this is disclosed and paired with manual review/no-auto-publish rules, but users should expect project state and review evidence to persist.

如何使用

确保已安装 OpenClaw（本地或 Docker 部署）
在对话框中输入安装命令：/install aicut-editing-assistant
安装完成后，直接呼叫该 Skill 的名称或使用 /aicut-editing-assistant 触发
根据 Skill 的参数说明提供必要输入，即可获得结构化输出

版本历史

v1.0.1

Remove legacy split Skill entries and keep one standard AICut Skill

v1.0.0

Initial public AI editing skill

元数据

Slug aicut-editing-assistant

版本 1.0.1

许可证 MIT-0

累计安装 2

当前安装数 2

历史版本数 2

常见问题