skills/multimodal-gen/SKILL.md
多模态内容生成(图片、视频)。当用户需要生成图片、生成图像、生成视频、AI绘画、AI作图、画一张图、做个视频、文生图、文生视频时使用此技能。自动调用 multimodal-agent 进行生成。
npx skillsauth add aaaaqwq/agi-super-team multimodal-genInstall this skill globally with one command. Works with Claude Code, Cursor, and Windsurf.
3 of 9 scanners reported clean
Some scanners were skipped, did not run, or reported a non-clean status. Review each row below.
当用户需要生成图片或视频时,自动调用 multimodal-agent 进行处理。
sessions_spawn(
agentId="multimodal-agent",
task="生成图片: {用户描述}, 使用 {模型} 模型"
)
| 别名 | 模型 | 特点 |
|------|------|------|
| flux | flux-pro-max | 高质量,推荐 |
| imagen | google/imagen-4-ultra | Google 最强 |
| dalle | gpt-image-1 | DALL-E 3 |
| doubao | doubao-seedream-4-5 | 中式美学 |
| klingimg | kling-image | 可灵生图 |
| 别名 | 模型 | 特点 |
|------|------|------|
| veopro | veo3.1-pro | Google 专业版 |
| veo4k | veo3.1-pro-4k | 4K 高清 |
| sora | sora-2-pro-all | OpenAI Sora |
| kling | kling-video | 可灵视频 |
用户请求 "生成一张猫咪图片"
│
▼
┌─────────────────────────────────────┐
│ 1. 识别为图片生成请求 │
│ 2. 提取描述: "猫咪" │
│ 3. 选择默认模型: flux-pro-max │
└─────────────────────────────────────┘
│
▼
┌─────────────────────────────────────┐
│ sessions_spawn( │
│ agentId="multimodal-agent", │
│ task="生成图片: 一只可爱的猫咪, │
│ 使用 flux 模型" │
│ ) │
└─────────────────────────────────────┘
│
▼
multimodal-agent 执行生成并返回结果
用户: 帮我生成一张日落海滩的图片
执行:
sessions_spawn(
agentId="multimodal-agent",
task="生成图片: 日落时分的海滩,金色阳光洒在海面上,使用 flux 模型"
)
用户: 用 sora 生成一个猫咪玩耍的视频
执行:
sessions_spawn(
agentId="multimodal-agent",
task="生成视频: 一只可爱的猫咪在草地上玩耍,使用 sora 模型"
)
用户: 用 doubao 画一张中国风山水画
执行:
sessions_spawn(
agentId="multimodal-agent",
task="生成图片: 中国风山水画,云雾缭绕的山峰,使用 doubao 模型"
)
| 场景 | 推荐模型 |
|------|----------|
| 通用高质量 | flux |
| 中式风格 | doubao |
| 写实照片 | imagen |
| 创意艺术 | dalle |
| 高清视频 | veo4k |
| 电影级视频 | sora |
| 快速视频 | kling |
development
Technology-agnostic prompt generator that creates customizable AI prompts for scanning codebases and identifying high-quality code exemplars. Supports multiple programming languages (.NET, Java, JavaScript, TypeScript, React, Angular, Python) with configurable analysis depth, categorization methods, and documentation formats to establish coding standards and maintain consistency across development teams.
tools
Expert-level browser automation, debugging, and performance analysis using Chrome DevTools MCP. Use for interacting with web pages, capturing screenshots, analyzing network traffic, and profiling performance.
data-ai
Prompt for creating detailed feature implementation plans, following Epoch monorepo structure.
tools
Interactive prompt refinement workflow: interrogates scope, deliverables, constraints; copies final markdown to clipboard; never writes code. Requires the Joyride extension.