skills/minimax-tools/SKILL.md
Configurar MiniMax M2.7 con MCP tools (web_search, understand_image) y Groq Whisper para audio. Ideal para agentes que necesitan búsqueda web, análisis de imágenes y transcripción de audio.
npx skillsauth add iberi22/swal-skills minimax-toolsInstall this skill globally with one command. Works with Claude Code, Cursor, and Windsurf.
3 of 9 scanners reported clean
Some scanners were skipped, did not run, or reported a non-clean status. Review each row below.
Este skill configura dos capacidades críticas para agentes SWAL:
web_search + understand_image para MiniMax M2.7uvx instalado# Linux/macOS
curl -LsSf https://astral.sh/uv/install.sh | sh
# Windows (PowerShell)
irm https://astral.sh/uv/install.ps1 | iex
ZeroClaw ya tiene MiniMax bundled con:
MiniMax-VL-01 — image understanding (incluido en minimax/MiniMax-M2.7)web_search — via MiniMax Coding Plan APIProblema conocido: La implementación de web_search en ZeroClaw oficial para MiniMax no está bien configurada. La solución es agregar el MCP server manualmente.
# En el contenedor/servidor donde corre ZeroClaw
zeroclaw mcp add MiniMax \
--command uvx \
--args minimax-coding-plan-mcp -y \
--env MINIMAX_API_KEY=tu_api_key \
--env MINIMAX_API_HOST=https://api.minimax.io
zeroclaw mcp list
# Debe mostrar: minimax-websearch, minimax-understand-image
mcp:
servers:
minimax:
command: uvx
args: ["minimax-coding-plan-mcp", "-y"]
env:
MINIMAX_API_KEY: "${MINIMAX_API_KEY}"
MINIMAX_API_HOST: "https://api.minimax.io"
MiniMax M2.7 no tiene capacidades de audio → usar Groq Whisper como fallback.
export GROQ_API_KEY=gsak_...
#!/bin/bash
# Transcribir audio OGG usando Groq Whisper API
# Uso: ./transcribe.sh audio.ogg
AUDIO_FILE="$1"
TEMP_FILE=$(mktemp /tmp/audio.XXXXXX.ogg)
cp "$AUDIO_FILE" "$TEMP_FILE"
curl -s -X POST "https://api.groq.com/openai/v1/audio/transcriptions" \
-H "Authorization: Bearer $GROQ_API_KEY" \
-F "file=@$TEMP_FILE" \
-F "model=whisper-large-v3" \
-F "language=es"
rm -f "$TEMP_FILE"
En el config.toml del agente:
[audio]
transcription_provider = "groq"
transcription_model = "whisper-large-v3"
groq_api_key = "${GROQ_API_KEY}"
# Requeridas
export MINIMAX_API_KEY="tu_minimax_key"
export GROQ_API_KEY="tu_groq_key"
# Opcionales
export DEFAULT_MODEL="minimax/MiniMax-M2.7"
export DEFAULT_PROVIDER="minimax"
# Verificar web_search
zeroclaw tools list | grep web_search
# Verificar image understanding
zeroclaw tools list | grep understand_image
# Verificar audio transcription
echo "GROQ_API_KEY configured: $(test -n "$GROQ_API_KEY" && echo YES || echo NO)"
# Test web search
zeroclaw invoke web_search --query "test"
# Test image understanding (requiere URL de imagen)
zeroclaw invoke understand_image --prompt "describe this image" --image_url "https://..."
# Test audio (requiere archivo de audio)
./transcribe.sh audio.ogg
En el contenedor swal-zeroclaw, agregar al docker-compose.swal.yml:
environment:
- MINIMAX_API_KEY=${MINIMAX_API_KEY}
- GROQ_API_KEY=${GROQ_API_KEY}
- DEFAULT_MODEL=minimax/MiniMax-M2.7
Y en el entrypoint:
# Instalar uvx si no existe
if ! command -v uvx &>/dev/null; then
curl -LsSf https://astral.sh/uv/install.sh | sh
fi
# Agregar MCP server
zeroclaw mcp add MiniMax \
--command uvx \
--args minimax-coding-plan-mcp -y \
--env MINIMAX_API_KEY=${MINIMAX_API_KEY} \
--env MINIMAX_API_HOST=https://api.minimax.io
Causa: La herramienta no está registrada correctamente. Solución:
MINIMAX_API_KEY tiene plan Coding Plan activozeroclaw daemon restartCausa: MiniMax-VL-01 requiere que la imagen sea pasada como URL o base64. Solución:
Causa: La variable no está configurada en el entorno del agente. Solución:
export GROQ_API_KEY=gsak_... # Agregar a secrets.env
source ~/.openclaw/secrets.env # Recargar en sesión
| Herramienta | Provider | API Key Requerida | Notas | |------------|----------|-------------------|-------| | web_search | MiniMax MCP | MINIMAX_API_KEY | Solo Coding Plan | | understand_image | MiniMax-VL-01 | MINIMAX_API_KEY | Bundled con M2.7 | | Audio transcription | Groq Whisper | GROQ_API_KEY | Fallback para audio |
Para la generación de exámenes (WorldExams), web_search es fundamental para:
"Usa la herramienta web_search para buscar el estándar actual del ICFES para [MATERIA] de grado [GRADO]. Luego genera 5 preguntas siguiendo ese formato JSON."
Este skill se activa automáticamente cuando:
minimax/MiniMax-M2.7secrets.env tenga GROQ_API_KEYtesting
Xavier2 as the central context engine for SWAL - intelligent memory, decision-making, and context orchestration. Xavier2 is the CEO brain that stores memories, coordinates agents, and maintains project state.
tools
Delegate coding tasks to Codex, Claude Code, or Pi agents via background process. Use when: (1) building/creating new features or apps, (2) reviewing PRs (spawn in temp dir), (3) refactoring large codebases, (4) iterative coding that needs file exploration. NOT for: simple one-liner fixes (just edit), reading code (use read tool), thread-bound ACP harness requests in chat (for example spawn/run Codex or Claude Code in a Discord thread; use sessions_spawn with runtime:"acp"), or any work in ~/clawd workspace (never spawn agents here). Claude Code: use --print --permission-mode bypassPermissions (no PTY). Codex/Pi/OpenCode: pty:true required.
testing
Validador automático para WorldExams. Verifica integridad técnica y calidad pedagógica, activando regeneración automática si es necesario.
tools
Generador de bundles de preguntas ICFES Colombia (Matemáticas, Lectura Crítica, Ciencias, Sociales, Inglés) para grados 6, 9 y 11 usando MiniMax MCP.