plugins/tools/cortex/skills/cortex-video-understand/SKILL.md
视频理解 — 多 provider VLM 视频分析。两种模式 video_url (zhipu glm-4v-plus / qwen-vl-max-video 原生视频) 与 frames (ffmpeg 抽帧走 image VLM, 兼容 openai gpt-4o)。从 vault/.cortex/config/video-understand.yaml 选 provider。Triggers on "看视频", "视频理解", "video understanding", "总结视频", "视频问答", "video QA", "/cortex:video-understand".
npx skillsauth add lazygophers/ccplugin cortex-video-understandInstall this skill globally with one command. Works with Claude Code, Cursor, and Windsurf.
3 of 9 scanners reported clean
Some scanners were skipped, did not run, or reported a non-clean status. Review each row below.
把视频喂给 VLM 拿文本结果。镜像 cortex-image-understand, 双模式适配不同 provider。
优先 CLI: bash ~/.cortex/scripts/video_understand.sh <subcommand> ...
describe <video> [--config NAME] [--prompt TEXT] [--mode video_url|frames] [--frames N]ask <video> "<question>" [--config NAME] [--mode] [--frames N]extract <video> --schema <path> [--config NAME] [--mode] [--frames N]probe [--config NAME] [--all]list [--all]输入: 本地路径或 http(s):// URL (frames 模式仅本地)
JSON 输出: {ok, text, provider, model, mode, frames_used?, usage}
| 模式 | 适用 provider | 原理 | 限制 |
|---|---|---|---|
| video_url | zhipu glm-4v-plus, qwen-vl-max-video, gemini | content array {type:"video_url", video_url:{url:...}} 直传 | provider 必须原生支持视频 |
| frames | openai gpt-4o, 任何 image VLM | ffmpeg 均匀抽 N 帧 → image_url 数组 | 需本地 ffmpeg; 静态帧丢失运动信息 |
provider 在 yaml 里写 mode: video_url|frames。--mode 临时覆盖。
不触发: 纯文本 / 纯音频 (走 cortex-audio-understand) / 视频生成
1. 选模式
↓ provider 配 mode=video_url? → 直接走
↓ 否则 ffmpeg 在否?
是 → frames 模式 (默认 8 帧)
否 → 报错提示装 ffmpeg 或换 video_url provider
↓
2. 选 prompt
describe → 默认中文总结 prompt
ask → user question
extract → schema + 内置抽取 prompt
↓
3. 调 video_understand.sh
↓
4. 接 JSON 输出文本/结构化结果
| name | endpoint | model | mode | |---|---|---|---| | zhipu-glm4v | bigmodel.cn/api/paas/v4 | glm-4v-plus | video_url | | openai-gpt4o-frames | api.openai.com/v1 | gpt-4o-mini | frames | | qwen-vl-max-video | dashscope.aliyuncs.com/compatible-mode/v1 | qwen-vl-max | video_url |
详见 references/providers.md。
default_provider 或第一个 active✓ 视频理解完成
provider: zhipu-glm4v (glm-4v-plus) mode=video_url
usage: prompt=4096 completion=512
<text>
frames 模式额外 frames_used: 8。
| 文件 | 内容 | |---|---| | references/providers.md | provider 配置模板 + mode 字段 + frames 参数 | | references/prompts.md | 视频描述 / 章节切分 / 字幕复刻 / 动作识别 prompt | | references/modes.md | video_url vs frames 决策 + ffmpeg 安装 + 已知坑 |
tools
--- name: trellisx-workspace description: 维护 `.trellis/task.md` 任务看板 —— trellis 缺的跨任务总览。**一个表格, 一行一个任务**, 列为 id/名称/描述/状态/阶段/进度/worktree (状态/阶段中文显示)。在 task create/start/阶段切换/archive 后**及时更新**对应行; 并**自动清理超 7 天的已完成行**防膨胀。保持看板与 task.json 实时一致。 when_to_use: 维护 / 创建 / 更新 `.trellis/task.md` 任务看板时; task 生命周期任一节点 (create/start/阶段推进/archive) 之后同步看板时; 用户问"当前有哪些任务 / 任务进度 / 任务看板"时。被 trellisx-flow 与 trellisx-apply 注入的流程引用。 user-invocable: true argument-hint: [show|update|sync|cleanup ...] [task id] arguments:
testing
强制以 Trellis task 闭环处理用户指定的请求 (自判新建/并入 → plan→exec→check→finish 全程不跳步)。**仅用户显式主动调用** (/trellisx-flow 或明确要求"强制走 task 处理这个"); **禁止自动 / 被动 / 推断式调用** —— 不要因为某个请求"看起来该建 task"就自动触发本 skill, 那是 apply 注入的 no_task 倾向的职责。
testing
把 强推task + subtask拆分 + worktree隔离 + 闭环收尾 四维度增量注入当前项目 .trellis/ (workflow.md 的 no_task/planning/in_progress 块 + spec 背书文档 + trellis 生命周期 hook worktree 自动化)。强推 task 与闭环为纯 prompt 软约束 (非平台 hook 硬拦截)。**纯增量追加, 绝不替换 trellis 原生文本** (no_task 分类+征同意/check/finish/前缀全保留)。幂等 (marker 包裹)。
development
Claude Code 会话历史整理 — 扫 ~/.claude/projects/**/*.jsonl 全部 session transcripts, 提取学习增量 (用户校正/决策/踩坑/L0 规则) → 全局记忆库 ~/.cortex/.wiki/memory/. 默认 --apply 落盘 (--dry-run opt-in 仅出 JSON plan 预览). 与 cortex-extract (L4-inbox 内部) 互补.