大家好,我是程序员晚枫。

如果你也做口播视频,肯定被一件事折磨过:

剪口播。

一遍 20 分钟的口播,可能口误 50 次、停顿 100 次、重复 30 次。

剪映的"智能剪口播" 又有两个致命问题:

  1. 不懂语义——重说、纠正的内容识别不出来
  2. 字幕不准——专业术语(Claude Code、MCP、API)经常错

今天给大家介绍一个专门解决这两个问题的工具——videocut-skills


一、videocut-skills 是什么?

一句话:用 Claude Code Skills 做的口播视频剪辑 Agent

不是云端 SaaS,是本地 Claude Code 装的技能——你给一个视频文件,AI 帮你识别问题片段,人工最后确认


二、为什么它比剪映强?

剪映做不到了,videocut-skills 做到了:

功能说明剪映
语义理解AI 逐句分析,识别重说/纠正/卡顿❌ 只能模式匹配
静音检测>0.3s 自动标记,阈值可调⚠️ 固定阈值
重复句检测相邻句开头 ≥5 字相同 → 删前保后❌ 无
句内重复"好我们接下来好我们接下来做" → 删重复❌ 无
词典纠错自定义专业术语词典❌ 无
自更新记住你的偏好,越用越准❌ 无

核心武器:Claude 的语义理解 + 自定义专业词典


三、效果演示

来自官方 README 的真实数据:

输入:19 分钟口播原片(各种口误、卡顿、重复)
输出

  • 自动识别 608 处问题(静音 114 + 口误/重复 494)
  • 剪辑后视频 72MB
  • 全程 AI 辅助,人工只需确认

19 分钟 → 几分钟人工确认 → 干净的视频。

📺 真实效果链接

作者也欢迎你把使用心得提到 Issues——多看几条 Issue 就能感受真实使用场景。


四、5 个 Skill 一览

Skill干什么输入输出
安装环境准备安装日志
剪口播转录 + AI 审核 + 剪辑视频文件剪辑后视频
字幕生成字幕视频文件带字幕视频
高清化2-pass + 锐化导出视频文件高清视频
自更新记录偏好用户反馈更新规则文件

五、3 步快速开始

第 1 步:安装 Skills

1
2
# 克隆到 Claude Code skills 目录
git clone https://github.com/Ceeon/videocut-skills.git ~/.claude/skills/videocut

第 2 步:配置 API Key

1
2
3
cd ~/.claude/skills/videocut
cp .env.example .env
# 编辑 .env,填入火山引擎 API Key(火山引擎的语音转录服务)

第 3 步:装环境

打开 Claude Code,输入:

1
/videocut:安装

AI 自动:

  • 检查 Python、FFmpeg、Node.js
  • 安装 FunASR(口误识别模型,约 2GB)
  • 安装 Whisper large-v3(字幕模型,约 3GB)

六、完整使用流程

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
┌─────────────────────────────────────────────┐
│ /videocut:安装(一次性) │
└─────────────────────────────────────────────┘

┌─────────────────────────────────────────────┐
│ /videocut:剪口播 视频.mp4 │
│ 1. 提取音频 → 上传云端 │
│ 2. 火山引擎转录 → 字级别时间戳 │
│ 3. AI 审核:静音/口误/重复/语气词 │
│ 4. 生成审核网页 → 浏览器打开 │
└─────────────────────────────────────────────┘

┌─────────────────────────────────────────────┐
│ 【人工审核 + 执行剪辑】 │
│ - 单击跳转播放 │
│ - 双击选中/取消 │
│ - Shift 拖动多选 │
│ - 确认后点「执行剪辑」→ FFmpeg 自动剪 │
└─────────────────────────────────────────────┘

┌─────────────────────────────────────────────┐
│ /videocut:字幕 │
│ - Whisper 转录 │
│ - 词典纠错(Claude Code → claude code) │
│ - 人工确认 → 烧录字幕 │
└─────────────────────────────────────────────┘

┌─────────────────────────────────────────────┐
│ /videocut:高清化(可选) │
│ - 2-pass 编码 + 锐化 │
│ - 自动匹配原片参数,码率 1.2x │
└─────────────────────────────────────────────┘

┌─────────────────────────────────────────────┐
│ /videocut:自更新(可选) │
│ 告诉 AI 你的偏好,它会记住: │
│ - "静音阈值改成 1 秒" │
│ - "保留适量嗯作为过渡" │
└─────────────────────────────────────────────┘

七、技术架构

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
┌──────────────────┐     ┌──────────────────┐
│ 火山引擎 ASR │────▶│ 字级别时间戳 │
│ (云端转录) │ │ subtitles.json │
└──────────────────┘ └────────┬─────────┘

┌──────────────────┐ ┌──────────────────┐
│ Claude Code │────▶│ AI 审核结果 │
│ (语义分析) │ │ auto_selected │
└──────────────────┘ └────────┬─────────┘

┌──────────────────┐ ┌──────────────────┐
│ 审核网页 │────▶│ 最终删除列表 │
│ (人工确认) │ │ delete_segments │
└──────────────────┘ └────────┬─────────┘

┌──────────────────┐ ┌──────────────────┐
│ FFmpeg │────▶│ 剪辑后视频 │
│ filter_complex │ │ xxx_cut.mp4 │
└──────────────────┘ └──────────────────┘

八、8 个审核规则(核心)

videocut-skills 的"魔法"在于审核规则——剪口播/用户习惯/ 目录:

规则干什么
1-核心原则删前保后(重复句保留后半段)
2-语气词检测嗯/啊/呃/哦
3-静音段处理>0.3s 删除(可调到 1s)
4-重复句检测相邻句开头 ≥5 字相同
5-卡顿词那个那个、就是就是
6-句内重复检测A+中间+A 模式
7-连续语气词嗯啊、啊呃
8-重说纠正部分重复、否定纠正

所有规则都可以通过 /videocut:自更新 自定义


九、自定义词典(专业术语纠错)

Whisper 默认会把 "Claude Code" 识别成 "cloud code"、"MCP" 识别成 "MC P"。

解决方案:编辑 字幕/词典.txt

1
2
3
4
5
Claude Code
MCP
API
GPT
Codex

每行一个词。AI 转录时优先用词典里的拼写


十、依赖

依赖用途安装方式
Node.js 18+跑脚本brew install node
FFmpeg音视频处理brew install ffmpeg
Python 3.8+模型运行系统自带
火山引擎 API语音转录申请 Key

十一、常见问题

Q: 火山引擎转录超时?

上传音频到 uguu.se(脚本默认),不要用 catbox.moe(火山引擎访问慢)。

Q: 审核网页打不开?

检查端口 8899 是否被占用:

1
lsof -i :8899

Q: 剪辑后音画不同步?

脚本已用 filter_complex + trim 处理(不用 concat demuxer)。

Q: 怎么添加自定义词典?

编辑 字幕/词典.txt,每行一个词。


总结

videocut-skills = 本地 Claude Code 装的"口播剪辑 Agent"

  • 19 分钟视频 → 几小时前剪 + 几分钟人工确认
  • 4 个 Skill:剪口播 + 字幕 + 高清化 + 自更新
  • 懂语义 + 懂专业术语 = 比剪映强 10 倍

如果你每周都要剪口播视频,这个工具省你一天时间

科技不高冷,AI 很好用。
我是晚枫,关注我,带你一起玩 AI!

💬 来评论区聊聊

你剪口播视频最头疼的是什么?
videocut-skills 的哪个功能你最想试?


🔗 快速链接


本文基于 videocut-skills 官方 README(2026-06)整理。