skills/video-screenshot/SKILL.md
视频截图提取工具。从录屏视频(微信聊天录屏、会议录屏等)中自动抽取关键帧、去重并保存为图片文件,可用作法律证据。支持场景变化检测、关键帧提取、固定间隔、智能去重四种策略,配合内容区 dHash、像素差异、SSIM、滚动帧合并、OCR 文本去重和可选复合复核模式;当前模型支持图像输入时可复核被丢弃候选帧,文字模型跳过复核。触发词:视频截图、录屏截图、聊天记录截图、抽帧去重、视频截帧、视频关键帧提取。不要用于:视频压缩、视频剪辑、音频提取。
npx skillsauth add cat-xierluo/legal-skills video-screenshotInstall this skill globally with one command. Works with Claude Code, Cursor, and Windsurf.
3 of 9 scanners reported clean
Some scanners were skipped, did not run, or reported a non-clean status. Review each row below.
从录屏视频(微信聊天录屏、会议录屏等)中自动抽取关键帧、去重并保存为可用作法律证据的图片文件。独立 Python CLI,无 Django 依赖。
确认用户提供的视频文件路径。支持常见视频格式:.mp4 .mov .avi .mkv .webm .flv .wmv .ts
默认配置(大多数场景无需调整):
| 参数 | 默认值 | 说明 |
|------|--------|------|
| 抽帧策略 | scene | 场景变化检测 |
| 场景阈值 | 0.10 | 变化幅度阈值(越小越敏感) |
| 定期采样间隔 | 2.0s | 静态画面保底采样(0=禁用) |
| 内容区裁剪 | 上 12% / 下 12% / 左右 4% | 排除状态栏、导航栏和边缘黑边后再比较 |
| dHash 去重阈值 | 4 | 对内容区计算汉明距离(0=禁用) |
| SSIM 阈值 | 0.93 | 结构相似度补充去重(0=禁用) |
| 滚动帧合并 | 关闭 | 需显式 --scroll-merge 开启 |
| OCR 去重 | 关闭 | 需显式开启 |
| 最小时间间隔 | 0.5s | 抑制同一时间段内过密保留帧(0=禁用) |
| 复核候选帧 | 关闭 | 需显式 --keep-drop-candidates 开启 |
| 最长边像素 | 0 | 保持原始分辨率(可设如 1920 限制尺寸) |
| JPEG 质量 | 2 | 最高质量(范围 1-31,越小越清晰) |
详细参数说明见 references/strategy-and-params.md,安装指南见 references/setup.md。
# 默认:场景检测 + 图像去重
uv run scripts/extract.py -i <视频文件路径>
# 场景检测 + OCR 去重(推荐用于聊天录屏)
uv run scripts/extract.py -i <视频文件路径> --ocr-dedup
# 复合复核模式:保留被算法丢弃的候选帧,供多模态模型回查
uv run scripts/extract.py -i <视频文件路径> --ocr-dedup --keep-drop-candidates
# 固定间隔,每 0.5 秒一帧
uv run scripts/extract.py -i <视频文件路径> -s interval --interval 0.5
# 关键帧提取,不去重
uv run scripts/extract.py -i <视频文件路径> -s keyframe -d 0
# 自定义输出目录
uv run scripts/extract.py -i <视频文件路径> -o /evidence/case_001/
# 更严格的场景检测(更多帧)
uv run scripts/extract.py -i <视频文件路径> --scene-threshold 0.15
# 禁用滚动帧合并(需要逐步滚动全过程时)
uv run scripts/extract.py -i <视频文件路径> --no-scroll-merge
输出目录包含:
| 文件 | 说明 |
|------|------|
| frame_001_00m00s.jpg | 保留帧(序号 + 时间戳命名) |
| frame_002_00m03s.jpg | 下一帧 |
| _report.json | 元数据报告(输入信息、去重统计、每帧 SHA256) |
| _review_candidates/ | 仅在 --keep-drop-candidates 开启时生成,保存被算法丢弃但可复核的候选帧 |
_report.json 可用于证据链追溯,记录了每帧的 SHA256 哈希、捕获时间戳和去重统计;复合模式下还会记录 review.drop_candidates,列明候选帧文件名、丢弃原因和时间戳。
归档目录中的 frames/ 只保留 _report.json 清单内的本次有效帧。每次运行前会清理输出目录中旧的 frame_*.jpg 和本工具报告文件,避免旧帧混入新结果;不会删除其他用户文件。
当用户担心算法漏掉关键截图,或反馈同一秒内截图过多时,优先使用复合复核模式:
uv run scripts/extract.py -i <视频文件路径> --ocr-dedup --keep-drop-candidates。_report.json 中 review.drop_candidates 记录的候选帧,重点看 min_gap、quality_*、duplicate_ssim、duplicate_scroll、ocr_duplicate 等原因对应的图片。_review_candidates/ 已生成但未做图像判断。| 策略 | 说明 | 推荐场景 |
|------|------|----------|
| scene | 场景变化检测,画面有显著变化时提取 | 聊天录屏、操作录屏(默认推荐) |
| keyframe | 仅提取视频关键帧(I 帧) | 压缩视频、快速浏览 |
| interval | 固定时间间隔提取 | 需要均匀时间采样 |
| smart | ffmpeg 智能去重 | 不确定时尝试 |
八级级联去重 + 可选过滤,每一级通过后才进入下一级:
--filter-blur 开启--ocr-dedup 开启--keep-drop-candidates 保存被前述规则丢弃的候选帧和原因,供多模态复核| 依赖 | 版本要求 | 安装方式 |
|------|----------|----------|
| ffmpeg | ≥ 5.0 | brew install ffmpeg |
| Python | ≥ 3.10 | 系统自带或 brew install python |
| uv | 最新 | brew install uv |
| Pillow | ≥ 10.0 | 自动安装(PEP 723 内联依赖) |
| rapidocr-onnxruntime | ≥ 1.0 | pip install rapidocr-onnxruntime(仅 OCR 去重需要) |
pdf:输出帧可组装为 PDF 证据包paddle-ocr:需要更高质量的 OCR 内容识别时,用输出帧作为输入legal-text-format:帧内容 OCR 后格式化video-compressor:抽帧前先压缩视频,减小 I/O 时间--max-size 参数_report.json 始终生成,确保证据可追溯data-ai
当用户要求你并行推进多个任务、一次性开多个 worker/agent 同时工作、用 tmux 启动多个独立 session、防止 PM 直接实现逃逸、或者你作为 PM 需要拆解并派发任务给多个独立 worker 时使用。触发词包括"并行推进""开多个""同时推进""派 worker""多 agent 并行""开 worker""tmux 启动""独立 session""防逃逸""分派任务""一起做"。不要用于单个短任务、跨平台任务状态管理、或 Git 分支/提交/PR/merge 安全规则。
tools
本技能应在 GitHub 项目发布新版本时使用,覆盖版本号管理、CHANGELOG 同步、Release Notes 撰写、tag 创建、CI 构建监控、发布验证和历史清理全流程。适用于桌面应用、CLI 工具、Web 应用、库/SDK 等任何基于 GitHub 的软件项目。当用户提到"发布"、"release"、"打 tag"、"新版本"、"更新版本号"、"写 release notes"、"发布失败了"、"CI 挂了"时触发。不要用于非 GitHub 项目(如纯 GitLab / Gitea 项目)或无需 CI 的手动发布场景。
content-media
本技能应在用户需要 OCR、扫描识别、图片文字识别、文档识别,或将 PDF、图片、Office 文档、URL 转换为 Markdown 时使用。检测到法律材料时可进行保守的法律术语与文书结构优化。不要用于法律事实判断、补写缺失内容、语义改写、印章深度识别或图表实体分析。
tools
将 monorepo 中的子目录通过 git subtree 推送到独立 GitHub 仓库。支持注册清单、变更自动检测、增量推送。本技能应在用户提交涉及已注册子项目的变更后,或手动请求推送到独立仓库时使用。不要用于初次创建 monorepo 或管理 git submodule。