.claude/skills/voice-inbox/SKILL.md
Transcripción de audio y flujo audio→texto→acción para mensajes de voz
npx skillsauth add gonzalezpazmonica/pm-workspace voice-inboxInstall this skill globally with one command. Works with Claude Code, Cursor, and Windsurf.
3 of 9 scanners reported clean
Some scanners were skipped, did not run, or reported a non-clean status. Review each row below.
Skill para transcribir mensajes de audio recibidos por WhatsApp o Nextcloud Talk, interpretar la intención del PM y ejecutar el comando correspondiente en pm-workspace.
Audio (.ogg/.opus/.m4a) → Faster-Whisper → Texto → Claude interpreta → Comando
download_media o Nextcloud Talk APIpip install faster-whisper --break-system-packages
| Modelo | RAM | Velocidad | Calidad | Uso recomendado |
|---|---|---|---|---|
| tiny | ~1 GB | Muy rápida | Básica | Test rápido, mensajes cortos claros |
| base | ~1 GB | Rápida | Buena | Mensajes cortos en entorno silencioso |
| small | ~2 GB | Media | Muy buena | Recomendado para uso diario |
| medium | ~5 GB | Lenta | Excelente | Audio con ruido o acentos fuertes |
| large-v3 | ~10 GB | Muy lenta | Máxima | Cuando la precisión es crítica |
El modelo se configura en messaging-config.md → WHISPER_MODEL.
Por defecto: small (buen equilibrio calidad/velocidad).
Faster-Whisper detecta idioma automáticamente, pero se puede forzar:
WHISPER_LANGUAGE = "es" → españolWHISPER_LANGUAGE = "auto" → detección automática (defecto)Una vez transcrito el audio, Claude recibe el texto con este prompt interno:
El PM ha enviado un mensaje de voz. Transcripción:
"{texto_transcrito}"
Analiza la intención y responde con:
1. Comando de pm-workspace más adecuado (con parámetros)
2. Confianza: alta/media/baja
3. Si confianza < alta → pedir confirmación al PM
Contexto: proyecto activo = {proyecto_actual}
Comandos disponibles: @docs/rules/domain/pm-workflow.md
| El PM dice... | Comando mapeado |
|---|---|
| "Ponme el estado del sprint de sala-reservas" | /sprint-status --project sala-reservas |
| "¿Cómo va la deuda técnica?" | /debt-track --project {activo} |
| "Descompón el PBI 1234 en tareas" | /pbi-decompose 1234 |
| "Genera el informe ejecutivo del sprint" | /report-executive --project {activo} |
| "Hazme un audit del proyecto nuevo" | /project-audit --project {activo} |
| "Manda el resumen del sprint al equipo por Slack" | /notify-slack #equipo {resumen} |
| "¿Qué alertas de seguridad hay?" | /security-alerts --project {activo} |
Si la transcripción no mapea claramente a un comando:
| Formato | Origen típico | Conversión necesaria |
|---|---|---|
| .ogg (Opus) | WhatsApp | No (Faster-Whisper lo soporta) |
| .m4a (AAC) | iOS WhatsApp | ffmpeg -i input.m4a output.wav |
| .webm (Opus) | Nextcloud Talk web | No |
| .wav | General | No |
ffmpeg instalado para conversiones de formatofaster-whisper instalado (pip install faster-whisper)testing
Create new skills, modify and improve existing skills, and measure skill performance. Use when users want to create a skill from scratch, edit, or optimize an existing skill, run evals to test a skill, benchmark skill performance with variance analysis, or optimize a skill's description for better triggering accuracy.
tools
Guide for creating high-quality MCP (Model Context Protocol) servers that enable LLMs to interact with external services through well-designed tools. Use when building MCP servers to integrate external APIs or services, whether in Python (FastMCP) or Node/TypeScript (MCP SDK).
tools
Sistema proactivo de bienestar individual
development
Search the web to resolve context gaps — documentation, versions, CVEs, best practices. Auto-starts SearxNG Docker if available, falls back to WebSearch.