剪辑 Agent:10 分钟自动剪视频

Claude Code Skills · 视频剪辑 · 阅读时间 10 分钟

用 Claude Code 的 Skills 功能,打造一个会学习的剪辑 Agent。自动识别口误、语气词、静音,可视化审核界面,越用越懂你。

10 分钟,自动剪一条 30 分钟的视频。

用户反馈

为什么做剪辑 Agent

我经常用剪映剪口播视频,用久了发现两个问题:

问题 1:智能剪口播无法理解语义

重复说的话,它识别不出来。一口气说二三十分钟,自己剪非常累。

问题 2:字幕错别字多

自动生成的字幕质量不好,每次都要手动改。

所以我用 Claude Code 的 Skills,做了一个剪辑 Agent。

根本区别

剪映需要你一帧帧检查,Agent 帮你全部识别完,你只需要确认。

三个核心设计

1. 自进化机制

这是最厉害的设计。

直接对比效果:

剪辑 Agent:

剪辑Agent识别结果

剪映:

剪映识别结果

同样一段视频,剪映漏掉的口误,Agent 全识别出来了。

为什么?因为它会学习。

每次执行任务后,你可以给反馈,Agent 会把反馈永久保存。

用 10 次,它就知道你 80% 的习惯。
用 50 次,它就完全符合你的需求。

越剪越懂你。

自更新循环机制

所有的识别规则,都放在一个独立的文件夹里:

规则文件夹结构

你觉得哪条规则不对,直接改文件就行。

2. 模型:API 秒级响应

上一版用本地模型,要下载 5GB,很多人直接放弃了。

这次换成火山引擎的 API:

3. 可视化交互

以前在命令行里看审查稿,一行行找口误,眼睛都看花了。

现在启动剪辑后,会自动弹出一个审核界面:

可视化审核界面

四个功能按钮

1 播放 — 自动跳过已选中的片段
2 倍速播放 — 说话慢的视频可以加速听
3 复制删除列表 — 让 Agent 学习你的习惯,下次更准
4 执行剪辑 — 确认无误后,一键完成

使用方法

15 分钟搞定。

四步流程图
1 下载 Skills(1分钟)
帮我下载剪辑 Skills: - 地址:https://github.com/Ceeon/videocut-skills - 存放路径:.claude/skills/(直接克隆到此目录,不要创建子文件夹)
2 配置 API Key(3分钟)

登录火山的模型管理,开通「音视频字幕生成」:https://console.volcengine.com/speech/new/setting/activate

火山引擎开通服务

免费 20 个小时试用。

获取 API Key,输入 /v,选择 videocut:安装,完成配置。

选择安装命令
3 剪口播(10分钟)

输入 /v,选择 videocut:剪口播,输入视频路径。

选择剪口播命令

Agent 会自动:

  1. 调用 API 转录
  2. 启动审核服务
  3. 打开审核界面
审核界面启动

操作方式:Shift + 拖动,选中或取消选中片段。

确认无误后,点击「执行剪辑」。

执行剪辑
4 加字幕(3分钟)

重点:自定义词典 = 字幕准确率翻倍

Skills 里预置了一个词典文件:

.claude/skills/videocut:字幕/词典.txt

打开这个文件,你会看到已经预设的词汇:

词典文件内容

你只需要在这个文件里添加你的专有名词就行。 比如你的公司名、产品名、频道名等:

成峰的频道 AI产品自由 我的品牌名

预先录入词典,AI 执行加字幕时,就会自动用你的词典去纠正模型的错误。第一次就准确。

然后输入 /v,选择 videocut:字幕

选择字幕命令

Agent 会自动:

  1. 转录
  2. 词典纠正错别字
  3. 生成字幕文件
  4. 让你确认字幕是否正确
  5. 确认无误后,烧录到视频

四步搞定,全程可视化。

让 Agent 越剪越懂你

这是最重要的一步。

如果你在审核时调整了很多片段,说明 Agent 还没完全理解你的习惯。

怎么做

  1. 审核完成后,点击「复制删除列表」
  2. 输入 /v,选择 videocut:自进化
  3. 把删除列表粘贴给 Agent

Agent 会分析你的修改:

然后把这些习惯永久记录到 Skills 里。

效果
用 10 次,它就知道你 80% 的习惯。
用 50 次,它就完全符合你的需求。

这就是自进化的威力 —— 越剪越懂你。

如果你经常剪口播视频,强烈推荐试试。记得一定要用自进化机制,这样 Agent 会越剪越懂你。

Skills 仓库地址:https://github.com/Ceeon/videocut-skills