src/skills/ollama-router/SKILL.md
Setup automatique Ollama de bout en bout : détecte → installe si absent → lance si éteint → détecte RAM → choisit preset → pull modèles manquants (+ nomic-embed-text) → configure proxy → écrit .env.local → healthcheck. Zéro question inutile.
npx skillsauth add malikkaraoui/claude-atelier ollama-routerInstall this skill globally with one command. Works with Claude Code, Cursor, and Windsurf.
3 of 9 scanners reported clean
Some scanners were skipped, did not run, or reported a non-clean status. Review each row below.
Jeffrey 🦙 sort de sa poche un câble, le branche, et attend le premier signal. Quand Ollama répond, il hoche la tête : « Local first. Always. »
"Un LLM local non connecté est juste du silicium dormant."
Configure le proxy Anthropic → Ollama pour utiliser un LLM local avec Claude Code.
Automatiser de bout en bout — ne rien demander à l'utilisateur si on peut agir.
which ollamabrew install ollama — si brew absent, curl -fsSL https://ollama.com/install.sh | shcurl -s --max-time 3 http://localhost:11434/api/tags échoue) : lancer ollama serve &>/dev/null & puis sleep 2 et revérifierollama serve en foreground. »ollama list
Si aucun modèle LLM n'est installé → passer directement à l'étape 3 (détection RAM + pull auto). Si des modèles existent → les lister et proposer le choix :
« Modèles disponibles :
mistral,llama3.1:8b,qwen3:8b. Lequel utiliser pour le proxy ? (ou Enter pour le preset auto basé sur ta RAM) »
Si l'utilisateur choisit un modèle → l'utiliser. Sinon → preset auto (étape 3).
Détection auto de la RAM :
# macOS
sysctl -n hw.memsize | awk '{print int($1/1073741824)}'
# Linux
grep MemTotal /proc/meminfo | awk '{print int($2/1048576)}'
Preset selon la RAM :
llama3.2:3b (léger, rapide)mistral (bon compromis)llama3.1:70b (lourd, plus capable)Annoncer le choix : « RAM détectée : X GB → preset standard (mistral). »
Vérifier ollama list et pull automatiquement ce qui manque, sans demander :
ollama pull <modèle>nomic-embed-text → requis pour la mémoire 3 niveaux en mode FULLSi le pull prend longtemps (> 10 GB), annoncer : « Pull en cours de llama3.1:70b (~40 GB) — ça peut prendre 30-60 min. »
Si aucun modèle n'était installé au départ, tout est transparent : détection RAM → pull preset → pull embeddings → tout est prêt.
go version
Si Go absent : brew install go (macOS) ou curl -fsSL https://go.dev/dl/go1.26.linux-amd64.tar.gz | sudo tar -C /usr/local -xzf - (Linux).
scripts/ollama-proxy/config.json (champ "model")cd scripts/ollama-proxy && go run main.go &>/tmp/ollama-proxy.log &
sleep 3
head -10 /tmp/ollama-proxy.logPORT=4001 go run main.go &>/tmp/ollama-proxy.log &Vérifier si .env.local existe à la racine. Ajouter ou mettre à jour la ligne :
ANTHROPIC_BASE_URL=http://localhost:4000
Si le fichier n'existe pas, le créer. Si la ligne existe déjà, signaler qu'elle est déjà configurée.
Comportement : si
.env.localexiste déjà, seule la ligneANTHROPIC_BASE_URLest ajoutée ou mise à jour — le reste du fichier est préservé tel quel. Aucune autre variable n'est touchée.
Note : ne jamais écrire
.env.localdans.claude/— il va à la racine du projet.
Ne pas attendre de confirmation — tester directement :
curl -s --max-time 3 http://localhost:4000/health
Réponse attendue : {"status":"ok","proxy":"ollama","version":"0.1.0"}
Si le healthcheck échoue :
go run main.go tourne : lsof -i :4000PORT=4001 + adapter ANTHROPIC_BASE_URLJeffrey 🦙 : « Proxy opérationnel. ANTHROPIC_BASE_URL pointe vers localhost:4000.
Lance `claude` — les messages seront routés vers <modèle>. Local first. Always. »
Rappeler les capacités :
v0.2.0 : tool_use / tool_result supportés — le proxy traduit les tools Anthropic → Ollama bidirectionnellement. Si le LLM local ne supporte pas les tools (modèle trop petit), les appels tools échoueront silencieusement.
go run main.go &).env.local automatiquement.env.local à la racine uniquement, jamais dans .claude/tools
Loop autonome PR → Copilot review → handoff JSON → fixes → merge. Lance le polling automatique après un git push sur une branche feature. Zéro intervention utilisateur.
data-ai
Tableau de contrôle des features claude-atelier (on/off, paramètres). Affiche l'état de chaque rail et permet de les activer/désactiver interactivement.
tools
Génère un handoff review structuré pour Copilot/GPT. Utiliser après une feature, un bug fix, ou quand > 100 lignes ont changé. Aussi déclenché automatiquement par §25.
testing
Ferme la boucle d'un handoff inter-LLM. Si response.content est null, va chercher les inline Copilot sur la PR GitHub associée et les retranscrit automatiquement. Puis classe les points, applique les fixes, génère l'intégration. Utiliser quand Copilot a reviewé une PR portant un handoff.