2393970875/deepsop-voice-clone/SKILL.md
声音复刻技能,使用 AI Artist API 进行音色克隆和语音合成。支持查询已有音色、上传音频创建新音色、使用指定音色合成语音。 ⚠️ 使用前必须设置环境变量 AI_ARTIST_TOKEN 为你的 API Key! 获取 API Key:访问 https://staging.kocgo.vip/index 注册登录后创建。 触发场景: - 用户要求生成语音,如"用蔡总的音色说..."、"生成一段语音"、"语音合成"等。 - 用户要求克隆音色,如"上传音频创建音色"、"复刻这个声音"、"创建我的音色"等。 - 用户查询已有音色,如"有哪些音色"、"列出音色"、"查看音色列表"等。 - 用户指定音色名称或 ID 进行语音合成。 - 用户发送语音消息后要求用该声音合成其他内容。
npx skillsauth add openclaw/skills voice-cloneInstall this skill globally with one command. Works with Claude Code, Cursor, and Windsurf.
3 of 9 scanners reported clean
Some scanners were skipped, did not run, or reported a non-clean status. Review each row below.
使用 AI Artist API 进行音色克隆和语音合成的完整解决方案。基于 CosyVoice v3.5 Plus 模型,支持高质量的音色复刻和文本转语音。
本技能提供三大核心功能:
| 功能 | 说明 | 典型场景 | |------|------|----------| | 查询音色 | 列出系统中所有可用音色 | 查看已有音色库,选择合适的声音 | | 音色克隆 | 上传音频创建新的音色 | 复刻自己的声音、领导的声音、明星声音等 | | 语音合成 | 使用指定音色生成语音 | 用特定声音朗读文本、生成配音、制作语音消息 |
访问 https://staging.kocgo.vip/index 注册并登录,然后在控制台创建你的 API Key。
在使用前,你必须先设置自己的 API Key:
# Windows PowerShell
$env:AI_ARTIST_TOKEN="sk-your_api_key_here"
# Linux/macOS/Git Bash (Windows)
export AI_ARTIST_TOKEN="sk-your_api_key_here"
python scripts/voice_clone.py --list
如果看到音色列表,说明配置成功!
# 1. 列出所有可用音色
python scripts/voice_clone.py --list
# 2. 使用音色 ID 合成语音
python scripts/voice_clone.py --synthesize --id 10 --text "大家好,我是测试语音"
# 3. 使用音色名称合成语音
python scripts/voice_clone.py --synthesize --name "蔡总的音色" --text "你好世界"
# 4. 下载合成的音频到本地
python scripts/voice_clone.py --synthesize --id 10 --text "你好" --download
# 使用本地音频文件创建音色
python scripts/voice_clone.py --create --name "我的音色" --audio "./my_voice.mp3"
# 使用在线音频 URL 创建音色
python scripts/voice_clone.py --create --name "我的音色" --audio-url "https://example.com/voice.mp3"
# 指定音色前缀
python scripts/voice_clone.py --create --name "客服音色" --audio "./cs.mp3" --prefix "CustomerService"
列出系统中所有音色及其状态:
python scripts/voice_clone.py --list
输出示例:
[INFO] 共有 4 个音色
可用音色列表:
[13] 王俏的音色 [OK] - cosyvoice-v3.5-plus
[12] 测试 11 [OK] - cosyvoice-v3.5-plus
[10] 蔡总的音色 [OK] - cosyvoice-v3.5-plus
[4] 测试音色 [OK] - cosyvoice-v3.5-plus
状态说明:
| 状态 | 说明 | 是否可用 |
|------|------|----------|
| OK | 音色已就绪 | ✅ 可用 |
| DEPLOYING | 音色部署中 | ❌ 暂不可用 |
| 其他 | 音色异常 | ❌ 不可用 |
python scripts/voice_clone.py --synthesize --id 13 --text "真正重要的东西,用眼睛是看不见的,只有用心才能看清。"
python scripts/voice_clone.py --synthesize --name "王俏的音色" --text "你好,欢迎使用库阔 AI"
# 下载到默认目录 (~/.openclaw/workspace/audio/)
python scripts/voice_clone.py --synthesize --id 13 --text "测试语音" --download
# 下载到指定目录
python scripts/voice_clone.py --synthesize --id 13 --text "测试语音" --download --output-dir "./my_audio"
# 支持 MP3、WAV 等常见格式
python scripts/voice_clone.py --create --name "我的声音" --audio "./my_voice.mp3"
# 使用完整路径
python scripts/voice_clone.py --create --name "领导音色" --audio "C:\Users\admin\Downloads\leader_voice.wav"
python scripts/voice_clone.py --create --name "网络音色" --audio-url "https://example.com/voice.mp3"
python scripts/voice_clone.py --create --name "客服小王" --audio "./wang.mp3" --prefix "CustomerService"
| 要求 | 说明 | |------|------| | 格式 | MP3、WAV、M4A 等常见音频格式 | | 时长 | 10-60 秒(推荐 30 秒左右) | | 音质 | 清晰的人声,无明显背景噪音 | | 内容 | 纯人声朗读,无背景音乐 | | 采样率 | 16kHz 或以上 |
你好,我是 XXX。这是一段用于音色克隆的录音样本。
我希望用我的声音来生成各种语音内容,包括问候语、通知、
故事朗读等。请确保录音清晰,语速适中,情感自然。
谢谢你的配合。
| 参数 | 必填 | 说明 |
|------|------|------|
| --list | 三选一 | 列出所有可用音色 |
| --synthesize | 三选一 | 语音合成模式 |
| --create | 三选一 | 创建新音色模式 |
| 参数 | 必填 | 说明 | 示例 |
|------|------|------|------|
| --id | 与 --name 二选一 | 音色 ID | --id 13 |
| --name | 与 --id 二选一 | 音色名称 | --name "王俏的音色" |
| --text | ✅ | 要合成的文本 | --text "你好世界" |
| --download | 否 | 下载音频到本地 | --download |
| --output-dir | 否 | 音频保存目录 | --output-dir "./audio" |
| 参数 | 必填 | 说明 | 示例 |
|------|------|------|------|
| --name | ✅ | 音色名称 | --name "我的音色" |
| --audio | 与 --audio-url 二选一 | 本地音频路径 | --audio "./voice.mp3" |
| --audio-url | 与 --audio 二选一 | 在线音频 URL | --audio-url "https://..." |
| --prefix | 否 | 音色前缀 | --prefix "DeepSop" |
# Windows PowerShell
$env:AI_ARTIST_TOKEN="sk-5c6c262755dc43d59ec5a742a7e80202"
# Linux/macOS
export AI_ARTIST_TOKEN="sk-5c6c262755dc43d59ec5a742a7e80202"
创建 .env 文件(在脚本同目录或技能根目录):
AI_ARTIST_TOKEN=sk-your_api_key_here
Windows:
[System.Environment]::SetEnvironmentVariable('AI_ARTIST_TOKEN', 'sk-your_api_key_here', 'User')
Linux/macOS:
echo 'export AI_ARTIST_TOKEN="sk-your_api_key_here"' >> ~/.bashrc
source ~/.bashrc
# 用蔡总的音色发送通知
python scripts/voice_clone.py --synthesize --name "蔡总的音色" \
--text "各位同事,下午三点在会议室召开周会,请准时参加。" --download
# 生成多个语音片段
python scripts/voice_clone.py --synthesize --id 13 --text "第一章:开始" --download --output-dir "./audiobook/ch1"
python scripts/voice_clone.py --synthesize --id 13 --text "第二章:发展" --download --output-dir "./audiobook/ch2"
python scripts/voice_clone.py --synthesize --id 13 --text "第三章:高潮" --download --output-dir "./audiobook/ch3"
# 为团队创建音色库
python scripts/voice_clone.py --create --name "客服小王" --audio "./wang.mp3"
python scripts/voice_clone.py --create --name "客服小李" --audio "./li.mp3"
python scripts/voice_clone.py --create --name "客服小张" --audio "./zhang.mp3"
# 查看音色列表
python scripts/voice_clone.py --list
# 收到语音后,用相同音色回复
# 1. 从语音消息提取音频
# 2. 创建音色(如果不存在)
python scripts/voice_clone.py --create --name "用户音色" --audio "./user_voice.wav"
# 3. 用该音色合成回复
python scripts/voice_clone.py --synthesize --name "用户音色" --text "收到,我会尽快处理。" --download
API Key 安全
.env 文件时加入 .gitignore音色状态检查
status: "OK" 的音色可用于语音合成DEPLOYING 状态的音色需要等待部署完成音频格式要求
文本长度限制
| 优化项 | 建议 | |--------|------| | 音频素材 | 使用 30 秒左右的清晰录音 | | 文本长度 | 单次合成不超过 200 字 | | 并发请求 | 避免同时发起多个合成请求 | | 错误处理 | 检查返回状态码,失败时重试 |
原因: 环境变量未设置
解决:
# Windows PowerShell
$env:AI_ARTIST_TOKEN="sk-your_api_key_here"
# 或创建 .env 文件
echo "AI_ARTIST_TOKEN=sk-your_api_key_here" > .env
原因: 音色正在部署中
解决: 等待几分钟后重新查询状态
python scripts/voice_clone.py --list
可能原因:
解决:
python scripts/voice_clone.py --list可能原因:
解决:
| 文件 | 说明 |
|------|------|
| scripts/voice_clone.py | 主脚本,包含所有功能实现 |
| references/api.md | API 详细文档,包含接口说明 |
| .env | 环境配置文件(需自行创建) |
| 接口 | 方法 | 说明 |
|------|------|------|
| /ai/voice/clone/list | GET | 查询音色列表 |
| /ai/voice/clone/sync/create | POST | 创建新音色 |
| /ai/voice/clone/synthesize | POST | 语音合成 |
| /system/fileUpload/upload | POST | 文件上传 |
详细 API 文档请查看 references/api.md
本技能支持以下扩展场景:
如有问题或建议,请联系技能维护者。
tools
Use when the user wants to connect to, test, or use the McDonalds service at mcp.mcd.cn, including checking authentication, probing MCP endpoints, listing tools, or calling McDonalds MCP tools through a reusable local CLI.
development
Web scraping platform — Twitter/X data, Vinted marketplace, and general web scraping API
development
SlowMist AI Agent Security Review — comprehensive security framework for skills, repositories, URLs, on-chain addresses, and products (Claude Code version)
data-ai
去除中文文本中的 AI 写作痕迹,使其读起来自然。基于维基百科 AI 写作特征指南,检测 24 种 AI 模式。触发词:humanizer-cn、去除 AI 痕迹、去除 AI 写作痕迹、中文文本人性化。