用 Claude Code 的 Skills 功能,打造一个会学习的剪辑 Agent。自动识别口误、语气词、静音,可视化审核界面,越用越懂你。
10 分钟,自动剪一条 30 分钟的视频。
我经常用剪映剪口播视频,用久了发现两个问题:
问题 1:智能剪口播无法理解语义
重复说的话,它识别不出来。一口气说二三十分钟,自己剪非常累。
问题 2:字幕错别字多
自动生成的字幕质量不好,每次都要手动改。
所以我用 Claude Code 的 Skills,做了一个剪辑 Agent。
剪映需要你一帧帧检查,Agent 帮你全部识别完,你只需要确认。
这是最厉害的设计。
直接对比效果:
剪辑 Agent:
剪映:
同样一段视频,剪映漏掉的口误,Agent 全识别出来了。
为什么?因为它会学习。
每次执行任务后,你可以给反馈,Agent 会把反馈永久保存。
用 10 次,它就知道你 80% 的习惯。
用 50 次,它就完全符合你的需求。
越剪越懂你。
所有的识别规则,都放在一个独立的文件夹里:
你觉得哪条规则不对,直接改文件就行。
上一版用本地模型,要下载 5GB,很多人直接放弃了。
这次换成火山引擎的 API:
以前在命令行里看审查稿,一行行找口误,眼睛都看花了。
现在启动剪辑后,会自动弹出一个审核界面:
15 分钟搞定。
帮我下载剪辑 Skills:
- 地址:https://github.com/Ceeon/videocut-skills
- 存放路径:.claude/skills/(直接克隆到此目录,不要创建子文件夹)
登录火山的模型管理,开通「音视频字幕生成」:https://console.volcengine.com/speech/new/setting/activate
免费 20 个小时试用。
获取 API Key,输入 /v,选择 videocut:安装,完成配置。
输入 /v,选择 videocut:剪口播,输入视频路径。
Agent 会自动:
操作方式:Shift + 拖动,选中或取消选中片段。
确认无误后,点击「执行剪辑」。
重点:自定义词典 = 字幕准确率翻倍
Skills 里预置了一个词典文件:
.claude/skills/videocut:字幕/词典.txt
打开这个文件,你会看到已经预设的词汇:
你只需要在这个文件里添加你的专有名词就行。 比如你的公司名、产品名、频道名等:
成峰的频道
AI产品自由
我的品牌名
预先录入词典,AI 执行加字幕时,就会自动用你的词典去纠正模型的错误。第一次就准确。
然后输入 /v,选择 videocut:字幕。
Agent 会自动:
四步搞定,全程可视化。
这是最重要的一步。
如果你在审核时调整了很多片段,说明 Agent 还没完全理解你的习惯。
怎么做:
/v,选择 videocut:自进化Agent 会分析你的修改:
然后把这些习惯永久记录到 Skills 里。
效果:
用 10 次,它就知道你 80% 的习惯。
用 50 次,它就完全符合你的需求。
这就是自进化的威力 —— 越剪越懂你。
如果你经常剪口播视频,强烈推荐试试。记得一定要用自进化机制,这样 Agent 会越剪越懂你。
Skills 仓库地址:https://github.com/Ceeon/videocut-skills