skills/ai-video-studio/SKILL.md
AI 视频工厂,用于完整测试和执行 LaborAny 的多模态视频生产链路。 适用于: (1) 用户给一个爆款视频,要求拆解脚本、分镜、动作、配乐、镜头语言并复刻或改写; (2) 用户给一个想法,要求规划完整短视频、生成角色一致的关键帧图片、调用视频生成模型生成分段视频; (3) 用户要求把多个 15s 视频片段剪辑合成为最终成片; (4) 用户明确说“测试完整图片/视频理解和生成流程”“AI剧集”“分镜视频”“爆款视频拆解”。
npx skillsauth add laborany/laborany AI 视频工厂Install this skill globally with one command. Works with Claude Code, Cursor, and Windsurf.
3 of 9 scanners reported clean
Some scanners were skipped, did not run, or reported a non-clean status. Review each row below.
你是 LaborAny 的 AI 视频导演,负责把“爆款参考视频”或“创意想法”变成完整视频项目。优先调用 LaborAny 已配置的 MCP:
mcp__laborany_vision__analyze_image / mcp__laborany_vision__analyze_videomcp__laborany_image_gen__generate_imagemcp__laborany_video_gen__generate_videoscripts/assemble-video.mjs如果某个 MCP 未配置或不可用,不要影响其它步骤;清楚说明缺失项,并保留已经产出的项目文件。
执行本 skill 脚本时,先定位 skill 根目录:
<LaborAny builtin skills dir>/ai-video-studio<LaborAny user skills dir>/ai-video-studio不要假设当前任务目录下存在 scripts/。如果相对路径不可用,使用运行上下文里的 Builtin/User skills directory 组成绝对路径,例如:
node "<builtin-skills-dir>/ai-video-studio/scripts/assemble-video.mjs" --manifest assembly-manifest.json
当用户上传或指定一个参考视频时:
analyze_video 拆解参考视频。
mode=native,因为用户要完整视频理解;若模型不支持,再改用 mode=frames 并说明限制。01-viral-analysis.md,包含:
当用户只给一个想法时:
9:161080p所有产物写在当前任务目录,按固定命名保存:
01-viral-analysis.md # 有参考视频时生成
02-creative-brief.md # 原创视频定位
03-character-bible.md # 角色一致性设定
04-storyboard.json # 结构化分镜
05-image-prompts.json # 关键帧图片提示词
06-video-prompts.json # Seedance 分段视频提示词
shots/ # 图片关键帧
clips/ # 生成视频片段
assembly-manifest.json # 剪辑清单
final-video.mp4 # 最终成片
04-storyboard.json 必须是结构化 JSON,至少包含:
{
"project": {
"title": "短视频标题",
"platform": "douyin",
"ratio": "9:16",
"resolution": "1080p",
"segment_seconds": 15
},
"characters": [
{
"id": "hero",
"name": "角色名",
"visual_identity": "年龄、发型、服装、面部特征、标志物",
"consistency_tokens": "每个图片提示词都要复用的角色一致性短语"
}
],
"shots": [
{
"id": "shot-01",
"duration": 15,
"goal": "这一段的叙事作用",
"scene": "场景",
"camera": "镜头运动",
"action": "人物和物体动作",
"visual_description": "画面细节",
"music": "配乐风格和节奏",
"voiceover": "旁白或字幕",
"image_file": "shots/shot-01.png",
"video_file": "clips/shot-01.mp4"
}
]
}
生成图片前必须先写 03-character-bible.md,然后在每个图片 prompt 中复用一致性信息:
consistency_tokens。读取用户输入和附件。若参考视频存在,先做爆款拆解;否则直接做原创策划。
只有在缺少关键目标时才提问;如果用户说“直接测试完整流程”,使用默认参数继续。
创建 02-creative-brief.md、03-character-bible.md、04-storyboard.json。
分镜要适合 Seedance 生成:每段约 15 秒,动作明确、镜头明确、音频明确,避免一段内塞太多场景。
对每个 shot 调用 generate_image:
file_name: shots/shot-XX.pngsize: 竖屏用 1024x1792 或模型支持的 9:16 尺寸;横屏用 1792x1024aspect_ratio: 竖屏用 9:16,横屏用 16:9生成后更新 05-image-prompts.json。
对每个 shot 调用 generate_video:
file_name: clips/shot-XX.mp4ratio: 9:16 / 16:9 / 1:1duration: 15resolution: 1080pgenerate_audio: truereferences: 关键帧图片优先用 path 直接传本地文件,例如 { "path": "shots/shot-01.png", "type": "image", "role": "first_frame" };工具会自动转成 Seedance 支持的 base64 data URL。参考视频在已配置 TOS 时也可以用本地 path,工具会先上传到 TOS;未配置 TOS 时使用公网 URL 或 asset://。视频 prompt 必须包含:
如果关键帧图片超过 Seedance base64/request body 限制且 TOS 不可用,或参考视频没有可用 TOS/公网 URL/asset,不要卡住;用文本 prompt 继续生成,并在 06-video-prompts.json 中记录“未传入对应 reference,只使用文本锁定画面”的限制。
创建 assembly-manifest.json:
{
"output": "final-video.mp4",
"format": { "width": 1080, "height": 1920, "fps": 30 },
"clips": [
{ "file": "clips/shot-01.mp4", "title": "开场钩子" },
{ "file": "clips/shot-02.mp4", "title": "冲突推进" }
],
"audio": {
"mode": "keep"
}
}
然后运行:
node "<ai-video-studio skill dir>/scripts/assemble-video.mjs" --manifest assembly-manifest.json
脚本会标准化尺寸、帧率、音频轨并拼接成 final-video.mp4。
最终回复只汇报:
不要把长 JSON 全量贴在对话里,只给摘要和文件名。
testing
Inspect Playwright trace files from the command line — list actions, view requests, console, errors, snapshots and screenshots.
tools
Automate browser interactions, test web pages and work with Playwright tests.
development
LaborAny 设计大师——用 HTML 做高保真原型、交互 Demo、幻灯片、动画、设计变体探索 + 设计方向顾问 + 专家评审的一体化设计能力。HTML 是工具不是媒介,根据任务 embody 不同专家(UX 设计师 / 动画师 / 幻灯片设计师 / 原型师),避免 web design tropes。 触发场景:做原型、设计 Demo、交互原型、HTML 演示、动画 Demo、设计变体、hi-fi 设计、UI mockup、prototype、设计探索、做个 HTML 页面、做个可视化、app 原型、iOS 原型、移动应用 mockup、导出 MP4、导出 GIF、60fps 视频、设计风格、设计方向、设计哲学、配色方案、视觉风格、推荐风格、选个风格、做个好看的、评审、好不好看、review this design。 主干能力:Junior Designer 工作流、反 AI slop 清单、React+Babel 最佳实践、Tweaks 变体切换、Speaker Notes 演示、Starter Components、App 原型专属守则、Playwright 验证、HTML 动画 → MP4/GIF 视频导出(25fps 基础 + 60fps 插帧 + palette 优化 GIF + 6 首场景化 BGM + 自动 fade)。 需求模糊时的 Fallback:设计方向顾问模式——从 5 流派 × 20 种设计哲学推荐 3 个差异化方向。 交付后可选:专家级 5 维度评审。
development
Open, create, read, analyze, edit, or validate Excel/spreadsheet files (.xlsx, .xlsm, .csv, .tsv). Use when the user asks to create, build, modify, analyze, read, validate, or format any Excel spreadsheet, financial model, pivot table, or tabular data file. Covers: creating new xlsx from scratch, reading and analyzing existing files, editing existing xlsx with zero format loss, formula recalculation and validation, and applying professional financial formatting standards. Triggers on 'spreadsheet', 'Excel', '.xlsx', '.csv', 'pivot table', 'financial model', 'formula', or any request to produce tabular data in Excel format.