
# Auto Tutorial — 全自动教程视频生成器 AI 驱动的浏览器教程视频录制工具,自动操控浏览器、截图、配音、合成视频。 ## 位置 `/Users/yay/workspace/auto-tutorial-v2/` ## 快速使用 ### 工具: tutorial_generate 一条命令生成完整教程视频。 **前提**: Brave 浏览器已打开目标网站,genspark-agent server 运行中。 ```bash cd /Users/yay/workspace/auto-tutorial-v2 # 1. 创建项目 PROJECT="projects/my_tutorial" mkdir -p "$PROJECT/screenshots" "$PROJECT/audio" "$PROJECT/output" # 2. 编写 plan.json(见下方格式) cat > "$PROJECT/plan.json" << 'EOF' { "title": "教程标题", "voice": "zh-CN-XiaoxiaoNeural",
Cloudflare Pages 静态网站部署,支持命令行一键部署、API 部署、项目管理
AI 视频全自动生产线 - opus.pro 视频生成 + OpusClip 字幕/元数据 + Genspark 高质量缩略图 + viaSocket → YouTube,全程零成本
# Newzik OMR MusicXML → ABC 乐谱处理 Skill ## 概述 Newzik/Maestria OMR v2.7.2 引擎将 PDF 乐谱转为 MusicXML,再通过 `xml2abc_plus.py` 自动修复常见错误并转为 ABC 格式。ABC 格式是纯文本,AI 可直接读取、理解、修正。 ## 快速上手 ### 1. 查看状态 ```bash cd /Users/yay/workspace/genspark-agent/skills/newzik-omr node newzik-manager.js status 2. 完整流程(上传 → OMR → 等待 → 下载 → 转 ABC) Copy node newzik-manager.js auto ./songs # 全自动(上传→提交→等待→下载) # 或分步: node newzik-manager.js upload ./songs # 上传 PDF(支持目录或单个文件) node newzik-manager.js submit # 提交 OMR node
# Reverse Engineering Skill ## 首要步骤(每次新对话必做) 开始逆向前,先查数据库获取所有可用工历史经验: ```sql -- 查看所有逆向工具 SELECT name, category, description, inject_method, usage_example, depends_on, output_location FROM reverse_engineering_tools ORDER BY category, id; -- 查看逆向相关踩坑经验 SELECT title, problem, solution FROM lessons_learned WHERE category='reverse-engineering'; ``` 新工具随时可加: ```sql INSERT OR REPLACE INTO reverse_engineering_tools (name, file_path, category, description, inject_method, usage_example, depends_on, ou
Supabase 后端即服务 (BaaS),提供 PostgreSQL 数据库、身份认证、实时订阅、存储等,免费套餐适合小项目
# viaSocket Flow 自动化管理 Skill ## 概述 通过逆向工程 viaSocket 平台 API,实现 agent 自主搜索插件、创建/配置/发布/执行自动化工作流。viaSocket 为 agent 提供通往数百个 SaaS 服务的云端操作层,flow 发布后 7x24 运行,无需本地机器在线。 ## 能力 - 插件发现: 搜索 50+ 外部插件 + 10 个内置工具 - Flow 生命周期: 创建 - 添加步骤 - 写入代码 - 发布 - 执行 - 查看日志 - 步骤类型: function, plugin, ifBlock, variable, comment, response, api, break - 执行方式: Webhook GET/POST, Dry-run, 定时触发 - 已授权服务: Google Sheets, YouTube, viaSocket Table, viaSocket Utilities, Gtwy ## 文件结构 skills/viasocket/ SKILL.md - 本文件 API
API Server - DeepSeek/Kimi 多模型 Agent,131个MCP工具,支持 tool calling 自动循环
This skill should be used when the user wants to visualize data. It intelligently selects the most suitable chart type from 26 available options, extracts parameters based on detailed specifications, and generates a chart image using a Python script.
Genspark AI 图片生成器 - 基于 nano-banana-pro 模型,支持任意比例、带文字渲染、自动上传公开托管,可用于缩略图/封面/社交媒体/插图等场景
# Odin AI Workflow 自动化管理 Skill ## 概述 通过 Odin AI 官方 Python SDK + API 实现 agent 自主管理工作流、自定义工具、代码脚本、Agent 等资源。Odin AI 提供企业级 AI Agent 平台,支持 200+ 集成,工作流发布后 7x24 云端运行。 ## 能力 - 项目管理: 列出/创建/更新项目 - Agent 管理: 创建/编辑/激活/停用自定义 Agent - 工作流(Workflows): 创建/编辑/激活/停用/复制/导入导出 n8n 风格节点工作流 - 自定义工具(Custom Tools): 创建/编辑/发布/执行/版本管理/定时调度 - 代码脚本(Code Scripts): 创建/执行/发布 Python/JS 脚本 - 知识库(Knowledge Base): 上传文件、管理文档 - 执行历史: 查看工作流执行记录和详情 - 数据表(Smart Tables): 结构化数据管理 ## 文件结构 skills/odin-workflow/ SKILL.md
SQLite 数据库操作工具,支持创建、查询、分析、导入导出数据
守护进程控制,用于重启 genspark-agent 主服务器
微信桌面版命令行控制工具,通过 macOS Accessibility API 读取聊天列表、消息内容,搜索联系人,发送消息
# AI Drive Skill 通过 `eval_js` 直接调用 Genspark AI Drive API。无需 DevTools、无需 navigate、无需 Chrome DevTools MCP。 ## 原理 `eval_js` 在当前页面的 MAIN world 执行 JS,与 genspark.ai 同源,自动携带 cookie(含 Cloudflare cf_clearance),所有 API 请求直接放行。 ## API 端点 | 操作 | 方法 | 端点 | |------|------|------| | 列目录 | GET | `/api/aidrive/ls/files/{path}/?filter_type=all&sort_by=name_asc&file_type=all&limit=100` | | 创建目录 | POST | `/api/aidrive/mkdir/files/{name}/` | | 上传文件 | POST | `/api/aidrive/upload/files/{dir}/{filename}` (FormData)
# AudioCleaner AI Skill 通过 audiocleaner.ai 的逆向 API 实现音频转视频和 AI 播客生成,无水印,无需登录。 ## 概述 - **站点**: https://audiocleaner.ai - **能力**: 音频转视频、AI 播客生成(文本/网页/YouTube/文档 → 多人对话播客) - **特点**: 无需登录、无水印、支持公开 URL 直传、多种宽高比/语言/风格 - **限制**: 音频最大 500MB,时长最长 30 分钟;未登录有次数限制 > ⚠️ 所有 API 请求需要在 audiocleaner.ai 的浏览器 tab 中通过 `eval_js` 发起(同源),直接 curl 会被 Cloudflare 拦截。 --- ## 一、Audio-to-Video API 将音频文件转换为 AI 生成的配图视频。 ### 1. 获取预签名上传 URL(本地文件用) ``` POST /audio/api/v1/oss/presign_url Content-Type: application/json {
浏览器页面脚本工具,通过 Chrome 扩展直接操控浏览器标签页,支持跨 tab 执行 JavaScript、抓取页面数据、操作 DOM 等
AI 音频分离工具,基于 Meta Demucs (Hybrid Transformer),支持人声/伴奏分离、多音轨分离
多媒体处理工具,支持视频/音频转换、剪辑、合并、提取、压缩等操作
MEGA 云存储命令行工具,支持文件上传、下载、同步、备份和分享
万能文档转换工具,支持 Markdown、HTML、PDF、Word、EPUB 等格式互转
手机推送通知工具,基于 ntfy.sh 免费服务,一行命令推送到手机