Adoption

Agent Skills are supported by leading AI development tools.

VS Code Gemini CLI GitHub Goose Amp Cursor Claude Code Letta OpenCode Claude OpenAI Codex Factory VS Code Gemini CLI GitHub Goose Amp Cursor Claude Code Letta OpenCode Claude OpenAI Codex Factory

yfge/video-pipeline

Name: video-pipeline
Author: yfge

skills/video-pipeline/SKILL.md

npx skillsauth add yfge/video-skills-suite video-pipeline

Clean

TrivyContainer and dependency vulnerability scanner

Clean

SemgrepStatic code analysis for vulnerabilities

Clean

mcp-scan (Snyk)Model Context Protocol security validation

Skipped

Snyk (dep)Open source security scanning

Skipped

Socket.devSupply chain security analysis

Skipped

VirusTotalMulti-engine malware detection

Skipped

CrowdStrikeAdvanced threat intelligence

Skipped

OSV-ScannerOpen Source Vulnerability database check

Skipped

OWASP Dep-Check

Video Pipeline — 视频内容全链路

一句话

丢一个视频进来，出一套完整的内容产品：文字稿 + 观点摘要 + 短视频切片 + 可发布文章。

链路总览

输入: 视频文件 (直播回放/播客/会议录像)
  │
  ▼
┌─────────────────────────────────────────────┐
│ Stage 1: video-to-text                       │
│ 转写 → 带时间戳的文字稿 + JSON               │
│ (去口吃的基础数据也在这里产生)                │
└──────────────────┬──────────────────────────┘
                   │
        ┌──────────┴──────────┐
        ▼                     ▼
┌───────────────┐   ┌─────────────────────┐
│ Stage 2:       │   │ Stage 3:             │
│ insight-       │   │ video-clipper        │
│ extractor      │   │ 按观点切片 →         │
│ 提炼观点/金句  │   │ 去静音/去口吃 →      │
│ /争议点        │   │ 短视频成品           │
└───────┬───────┘   └─────────────────────┘
        │
        ▼
┌───────────────────────────────────────────┐
│ Stage 4: article-forge                     │
│ 观点摘要 + 原始文稿 → 可发布文章            │
│ (博客/知乎/公众号)                          │
└───────────────────────────────────────────┘

输出目录: workspace/pipeline/<project-name>/
  ├── transcript.txt          # 完整文字稿
  ├── transcript.json         # 带时间戳 JSON
  ├── insights.md             # 观点摘要
  ├── clips/                  # 短视频切片
  │   ├── 01-xxx.mp4
  │   ├── 02-xxx.mp4
  │   └── ...
  └── articles/               # 生成的文章
      ├── blog-xxx.md
      └── zhihu-xxx.md

执行流程

输入参数

用户给出：

视频文件路径（必须）
项目名（可选，默认从文件名生成）
目标产出（可选，默认全部）：
- transcript — 只要文字稿
- insights — 文字稿 + 观点
- clips — 文字稿 + 切片
- articles — 文字稿 + 观点 + 文章
- all — 全部（默认）
文章平台（可选）：blog / zhihu / wechat
切片数量（可选，默认 5-8 条）

Stage 1: 转写（video-to-text）

读取 video-to-text SKILL.md
创建项目目录：workspace/pipeline/<project-name>/

用 nohup 后台执行转写脚本：

nohup python3 {video-to-text-skillDir}/scripts/transcribe.py \
  /path/to/video.mp4 \
  --output-dir workspace/pipeline/<project-name>/ \
  --output-name transcript \
  --diarize \
  > /tmp/pipeline-transcribe.log 2>&1 &

等待完成（用 process poll 或检查输出文件）
产出：transcript.txt + transcript.json

⚠️ 这是最耗时的阶段，30 分钟视频大约需要 10-20 分钟转写。后续阶段都很快。

Stage 2: 观点提炼（insight-extractor）

读取 insight-extractor SKILL.md
输入 transcript.txt
按 insight-extractor 流程提炼：
- 话题边界识别
- 核心论点提取
- 金句标注（保留时间戳）
- 争议点标注
产出：insights.md

关键： 金句和观点的时间戳要精确，Stage 3 切片需要用。

Stage 3: 视频切片（video-clipper）

可以和 Stage 2 并行（都只依赖 Stage 1 的输出）。

读取 video-clipper SKILL.md
基于 insights.md 的观点 + transcript.json 的时间戳定位切片边界
执行四阶段切片流程：
- 用 batch-clip-v4.sh 批量切片（去静音 + 去口吃 + crossfade）
- 用 batch-postcheck.sh 二次质检
- 必要时用 iterate-until-clean.py 迭代修复
产出：clips/01-xxx.mp4, clips/02-xxx.mp4, ...

优化： 优先切 insights 中标记为「金句」和「争议点」的片段——这些做短视频最有传播力。

Stage 4: 文章生成（article-forge）

读取 article-forge SKILL.md
输入 insights.md + transcript.txt
根据目标平台选择文体和风格
生成文章，严格执行去 AI 味
产出：articles/blog-xxx.md 或 articles/zhihu-xxx.md

可选： 如果用户要求发布，调用 ZhiForge 的发布流程。

并行策略

时间线:
─────────────────────────────────────────────────>
  Stage 1 (转写)     Stage 2 (观点)     Stage 4 (文章)
  ████████████████    ████████           ████████
                      Stage 3 (切片)
                      ████████████████

Stage 2 和 Stage 3 可以并行（用 sessions_spawn 分别跑）
Stage 4 依赖 Stage 2 的输出，串行
Stage 1 最慢，占总时间 60-70%

子 agent 编排

推荐用 sessions_spawn 并行化：

主 agent:
  1. 启动 Stage 1（转写，等待完成）
  2. spawn 子 agent A → Stage 2（观点提炼）
  3. spawn 子 agent B → Stage 3（视频切片）
  4. 等 A 完成 → 启动 Stage 4（文章生成）
  5. 等 B 完成 → 汇总输出

输出汇总模板

全部完成后，向用户汇报：

🎬 视频内容处理完成

📹 源文件：xxx.mp4 (时长 XX:XX)
📁 项目目录：workspace/pipeline/<name>/

📝 文字稿：transcript.txt (XXXX 字)
💡 观点提炼：insights.md
   - X 个核心观点
   - X 条金句
   - X 个争议点

🎞️ 短视频切片：X 条
   - 01-xxx.mp4 (XX:XX) — 主题
   - 02-xxx.mp4 (XX:XX) — 主题
   - ...

📄 文章：X 篇
   - blog-xxx.md (XXXX 字) — 标题
   - zhihu-xxx.md (XXXX 字) — 标题

快速触发

用户说以下任何一种，触发此 skill：

"处理这个视频"
"视频全链路"
"直播回放处理"
"把这个视频变成内容"
"video pipeline"

默认执行 all（全部产出），除非用户指定只要某个阶段。

注意事项

Stage 1 转写必须用 nohup 后台，否则超时
文件名含中文要建英文 symlink
切片依赖 transcript.json 的 word_segments，不是 transcript.txt
文章生成依赖 insights.md，不能跳过 Stage 2 直接到 Stage 4
所有产出存 workspace/pipeline/<project-name>/，不用 /tmp/
用完浏览器后必须 browser stop

yfge/video-pipeline

skills/video-pipeline/SKILL.md

视频内容全链路处理。一个视频进去，文字稿+观点摘要+短视频切片+可发布文章全出来。串联 video-to-text → insight-extractor → video-clipper → article-forge 四个 skill 的完整流水线。适用于：直播回放、播客、会议录像的一站式内容加工。

1 stars

tools

Updated Apr 21, 2026

$ install --global

skillsauth

npx skillsauth add yfge/video-skills-suite video-pipeline

Install this skill globally with one command. Works with Claude Code, Cursor, and Windsurf.

Security Scan Results

3 of 9 scanners reported clean

Some scanners were skipped, did not run, or reported a non-clean status. Review each row below.

Scanners Passed

Scanners in report

Clean

TrivyContainer and dependency vulnerability scanner

95%

Clean

SemgrepStatic code analysis for vulnerabilities

95%

Clean

mcp-scan (Snyk)Model Context Protocol security validation

95%

Skipped

Snyk (dep)Open source security scanning

50%

Skipped

Socket.devSupply chain security analysis

50%

Skipped

VirusTotalMulti-engine malware detection

50%

Skipped

CrowdStrikeAdvanced threat intelligence

50%

Skipped

OSV-ScannerOpen Source Vulnerability database check

50%

Skipped

OWASP Dep-Check

50%

Last scanned: Apr 22, 2026, 3:00 AM24.9s1 file scanned

SKILL.md

name:: video-pipeline
description:: 视频内容全链路处理。一个视频进去，文字稿+观点摘要+短视频切片+可发布文章全出来。串联 video-to-text → insight-extractor → video-clipper → article-forge 四个 skill 的完整流水线。适用于：直播回放、播客、会议录像的一站式内容加工。
user-invocable:: true
metadata:: {"openclaw": {"emoji": "🎬"}}

Video Pipeline — 视频内容全链路

一句话

丢一个视频进来，出一套完整的内容产品：文字稿 + 观点摘要 + 短视频切片 + 可发布文章。

链路总览

输入: 视频文件 (直播回放/播客/会议录像)
  │
  ▼
┌─────────────────────────────────────────────┐
│ Stage 1: video-to-text                       │
│ 转写 → 带时间戳的文字稿 + JSON               │
│ (去口吃的基础数据也在这里产生)                │
└──────────────────┬──────────────────────────┘
                   │
        ┌──────────┴──────────┐
        ▼                     ▼
┌───────────────┐   ┌─────────────────────┐
│ Stage 2:       │   │ Stage 3:             │
│ insight-       │   │ video-clipper        │
│ extractor      │   │ 按观点切片 →         │
│ 提炼观点/金句  │   │ 去静音/去口吃 →      │
│ /争议点        │   │ 短视频成品           │
└───────┬───────┘   └─────────────────────┘
        │
        ▼
┌───────────────────────────────────────────┐
│ Stage 4: article-forge                     │
│ 观点摘要 + 原始文稿 → 可发布文章            │
│ (博客/知乎/公众号)                          │
└───────────────────────────────────────────┘

输出目录: workspace/pipeline/<project-name>/
  ├── transcript.txt          # 完整文字稿
  ├── transcript.json         # 带时间戳 JSON
  ├── insights.md             # 观点摘要
  ├── clips/                  # 短视频切片
  │   ├── 01-xxx.mp4
  │   ├── 02-xxx.mp4
  │   └── ...
  └── articles/               # 生成的文章
      ├── blog-xxx.md
      └── zhihu-xxx.md

执行流程

输入参数

用户给出：

视频文件路径（必须）
项目名（可选，默认从文件名生成）
目标产出（可选，默认全部）：
- transcript — 只要文字稿
- insights — 文字稿 + 观点
- clips — 文字稿 + 切片
- articles — 文字稿 + 观点 + 文章
- all — 全部（默认）
文章平台（可选）：blog / zhihu / wechat
切片数量（可选，默认 5-8 条）

Stage 1: 转写（video-to-text）

读取 video-to-text SKILL.md
创建项目目录：workspace/pipeline/<project-name>/

用 nohup 后台执行转写脚本：

nohup python3 {video-to-text-skillDir}/scripts/transcribe.py \
  /path/to/video.mp4 \
  --output-dir workspace/pipeline/<project-name>/ \
  --output-name transcript \
  --diarize \
  > /tmp/pipeline-transcribe.log 2>&1 &

等待完成（用 process poll 或检查输出文件）
产出：transcript.txt + transcript.json

⚠️ 这是最耗时的阶段，30 分钟视频大约需要 10-20 分钟转写。后续阶段都很快。

Stage 2: 观点提炼（insight-extractor）

读取 insight-extractor SKILL.md
输入 transcript.txt
按 insight-extractor 流程提炼：
- 话题边界识别
- 核心论点提取
- 金句标注（保留时间戳）
- 争议点标注
产出：insights.md

关键： 金句和观点的时间戳要精确，Stage 3 切片需要用。

Stage 3: 视频切片（video-clipper）

可以和 Stage 2 并行（都只依赖 Stage 1 的输出）。

读取 video-clipper SKILL.md
基于 insights.md 的观点 + transcript.json 的时间戳定位切片边界
执行四阶段切片流程：
- 用 batch-clip-v4.sh 批量切片（去静音 + 去口吃 + crossfade）
- 用 batch-postcheck.sh 二次质检
- 必要时用 iterate-until-clean.py 迭代修复
产出：clips/01-xxx.mp4, clips/02-xxx.mp4, ...

优化： 优先切 insights 中标记为「金句」和「争议点」的片段——这些做短视频最有传播力。

Stage 4: 文章生成（article-forge）

读取 article-forge SKILL.md
输入 insights.md + transcript.txt
根据目标平台选择文体和风格
生成文章，严格执行去 AI 味
产出：articles/blog-xxx.md 或 articles/zhihu-xxx.md

可选： 如果用户要求发布，调用 ZhiForge 的发布流程。

并行策略

时间线:
─────────────────────────────────────────────────>
  Stage 1 (转写)     Stage 2 (观点)     Stage 4 (文章)
  ████████████████    ████████           ████████
                      Stage 3 (切片)
                      ████████████████

Stage 2 和 Stage 3 可以并行（用 sessions_spawn 分别跑）
Stage 4 依赖 Stage 2 的输出，串行
Stage 1 最慢，占总时间 60-70%

子 agent 编排

推荐用 sessions_spawn 并行化：

主 agent:
  1. 启动 Stage 1（转写，等待完成）
  2. spawn 子 agent A → Stage 2（观点提炼）
  3. spawn 子 agent B → Stage 3（视频切片）
  4. 等 A 完成 → 启动 Stage 4（文章生成）
  5. 等 B 完成 → 汇总输出

输出汇总模板

全部完成后，向用户汇报：

🎬 视频内容处理完成

📹 源文件：xxx.mp4 (时长 XX:XX)
📁 项目目录：workspace/pipeline/<name>/

📝 文字稿：transcript.txt (XXXX 字)
💡 观点提炼：insights.md
   - X 个核心观点
   - X 条金句
   - X 个争议点

🎞️ 短视频切片：X 条
   - 01-xxx.mp4 (XX:XX) — 主题
   - 02-xxx.mp4 (XX:XX) — 主题
   - ...

📄 文章：X 篇
   - blog-xxx.md (XXXX 字) — 标题
   - zhihu-xxx.md (XXXX 字) — 标题

快速触发

用户说以下任何一种，触发此 skill：

"处理这个视频"
"视频全链路"
"直播回放处理"
"把这个视频变成内容"
"video pipeline"

默认执行 all（全部产出），除非用户指定只要某个阶段。

注意事项

Stage 1 转写必须用 nohup 后台，否则超时
文件名含中文要建英文 symlink
切片依赖 transcript.json 的 word_segments，不是 transcript.txt
文章生成依赖 insights.md，不能跳过 Stage 2 直接到 Stage 4
所有产出存 workspace/pipeline/<project-name>/，不用 /tmp/
用完浏览器后必须 browser stop

Related Skills

yfge/video-to-text

content-media

VerifiedTrustedCommunity

视频/音频转文字稿。从视频文件中提取音频，用 whisperX 进行语音识别、时间戳对齐和说话人分离，输出带时间戳和说话人标签的文字稿。适用于：直播回放转写、会议录音转文字、播客转录、任何视频/音频转文稿的场景。

1SKILL.mdUpdated Apr 21, 2026

yfge/video-clipper

tools

VerifiedTrustedCommunity

从长视频（直播回放、会议录像、播客）中批量生成短视频切片。基于转写文稿精确定位观点边界，自动去除静音卡顿和口吃，输出音画同步的短视频。适用于：直播切片、会议精华提取、短视频二创、播客精彩片段。

1SKILL.mdUpdated Apr 21, 2026

yfge/insight-extractor

tools

VerifiedTrustedCommunity

从长文本（直播文稿、会议记录、播客转录、文章）中提炼核心观点、金句、争议点和行动项。输出结构化的观点摘要，可直接供 article-forge 等下游 skill 使用。适用于：直播回放分析、会议纪要提炼、长文精读、内容策划前的素材整理。

1SKILL.mdUpdated Apr 21, 2026

yfge/insight-extractor

yfge/article-forge

data-ai

VerifiedTrustedCommunity

从观点摘要和原始素材生成可发布的文章。支持多种文体（博客、知乎回答、公众号、技术文章），自动应用防 AI 写作规则。适用于：直播内容二次创作、观点输出为文章、素材整合成稿、任何"有料但还没成文"的场景。

1SKILL.mdUpdated Apr 21, 2026

Download

For Claude Desktop. Download once, then upload the file in the app — no terminal needed.

Need help? View full Cowork setup guide →

Install manually

Choose your platform

# Clone the repo
git clone https://github.com/yfge/video-skills-suite.git

# Copy into Claude Code skills folder (global)
cp -r video-skills-suite/skills/video-pipeline ~/.claude/skills/

Claude Code Skills — official skills path docs.

Repository

yfge/video-skills-suite

1 stars

Compatible with

Claude Code

OpenAI Codex CLI

ChatGPT