skills/46-post-deploy-canary-monitor/SKILL.md
Vigia producao apos deploy fechar, comparando metricas e screenshots contra baseline pre-deploy. Detecta regressao silenciosa (console errors, perf drop, broken pages) nas primeiras horas/dias. Diferente de skill 43 (canary-deployment) que faz promocao gradual durante o deploy: esta skill comeca QUANDO o deploy ja fechou 100% e fica vigiando ate confirmar que esta saudavel ou escalar pra rollback. Trigger em: "monitor producao", "monitora producao", "monitora se", "watch deploy", "watch production", "post-deploy check", "pos-deploy", "depois do deploy", "depois do rollout", "vigiar producao", "regressao silenciosa", "deploy passou mas", "verificar producao", "deploy stuck", "production health check", "screenshot diff", "lcp regrediu", "baseline comparativo".
npx skillsauth add felvieira/claude-skills-fv post-deploy-canary-monitorInstall this skill globally with one command. Works with Claude Code, Cursor, and Windsurf.
3 of 9 scanners reported clean
Some scanners were skipped, did not run, or reported a non-clean status. Review each row below.
Inspiracao: gstack/canary (MIT, Garry Tan). Adaptado: foca em pos-deploy (depois do 100% rollout), enquanto skill 43 cobre durante o rollout gradual.
| | Skill 43 canary-deployment | Skill 45 post-deploy-canary-monitor (esta) | |------------------|----------------------------|--------------------------------------------| | Momento | DURANTE o rollout (0% → 100%) | DEPOIS do rollout completar (100% live) | | Decisao | Promover ou abortar deploy | Manter producao ou rollback | | Mecanismo | Traffic split, feature flag, blue-green | Polling de metricas + screenshot diff | | Termina quando | 100% completo OU abortou | Janela de observacao expirou OK | | Escalacao | (proprio rollback do canary) | Chama skill 43 (rollback) ou skill 24 (release-manager) |
Segue GLOBAL.md, policies/verification-before-completion.md (a verificacao continua
apos deploy fechar), policies/handoffs.md (escalacao pra skill 43), policies/observability-trace-tags.md.
Quando memory/constitution.md define SLOs no eixo Performance/Reliability:
url: https://prod.exemplo.com
baseline:
metrics: ./baseline/metrics-pre-deploy.json
screenshots: ./baseline/screenshots/
thresholds:
console_errors_per_min: 0 # zero tolerancia
lcp_regression_pct: 20 # >20% pior que baseline = abort
cls_regression_pct: 25
screenshot_diff_pct: 5 # >5% de pixels diferentes em paginas-chave
status_5xx_pct: 1 # >1% de respostas 5xx
window:
interval: 15m
duration: 24h
abort_after_consecutive_failures: 2
escalation:
on_abort: skill-43-rollback # ou comando manual
notify: <slack-channel | email>
Se nao houver baseline ainda, capturar antes do deploy:
# Metricas
curl -s "$URL/metrics" > baseline/metrics-pre-deploy.json
# Screenshots de paginas-chave (Playwright via anthropic-skills:webapp-testing)
# - homepage
# - 2-3 paginas mais traficadas
# - 1 fluxo critico (checkout, login, search)
A cada interval (default 15min), por ate duration (default 24h):
docs/canary-runs/YYYY-MM-DD-<release>/timeline.jsonl:{"t":"15:00","status":"ok","lcp_delta":-2,"errors":0,"screenshot_diff":0.4}
{"t":"15:15","status":"ok","lcp_delta":+5,"errors":0,"screenshot_diff":0.6}
{"t":"15:30","status":"alert","lcp_delta":+22,"errors":3,"screenshot_diff":7.2,"reason":"lcp_regression+errors"}
healthyAo detectar 2 falhas consecutivas:
docs/canary-runs/.../abort.md/run-program rollback ou skill 43 reverseNAO faz rollback automatico por default. Producao = decisao humana, salvo override explicito no input.
Ao final da janela sem aborts:
healthy em docs/canary-runs/.../verdict.mddocs/releases/<versao>.md com link pro reportdocs/canary-runs/2026-05-27-v2.19.0/
├── input.yaml # config usada
├── baseline/
│ ├── metrics.json
│ └── screenshots/
├── timeline.jsonl # 1 linha por check
├── abort.md (se houve) # detalhes do incidente
└── verdict.md # healthy | rolled-back | aborted
anthropic-skills:webapp-testing (Playwright) — captura screenshotsduration finito (24h-7d max)testing
Skill do Product Owner para especificação de features. Use quando precisar definir requisitos de negócio, escrever user stories, critérios de aceitação, priorização de backlog, ou qualquer documento de especificação de produto. Inclui fundamento de negócio para discovery: validação de hipótese, problema vs. necessidade, MVP, modelo de monetização e métricas pirata (AARRR) como input da spec. Trigger em: "nova feature", "especificação", "user story", "requisito", "backlog", "PO", "definir escopo", "critério de aceitação", "MVP", "roadmap", "validação de hipótese", "discovery", "monetização", "pricing", "product-market fit", "métricas AARRR".
development
Skill compositora que pega texto/assunto e gera post de blog HTML completo no repo {blog_repo_path} ({github_user_repo_url}), com imagens (via skill 17 fal.ai ou skill 42 Playwright screenshot), commit+push automático, retorna URL pública via GitHub Pages. Trigger em: "post no blog", "publicar post", "escrever post", "blog post", "publish blog", "gera post", "criar post", "novo post no meu blog".
tools
Audita o peso de contexto carregado na sessão — CLAUDE.md, agents, MCP descriptions, rules ativas, skills invocadas e histórico acumulado. Estima tokens por componente, reporta headroom disponível e emite alertas de overflow. Distinto do cost-tracker (skill 30) que rastreia tokens gastos em completions runtime. Trigger em: "contexto inchado", "context overflow", "quanto contexto estou usando", "peso do contexto", "context budget", "tokens carregados", "sessao lenta", "respostas degradadas", "headroom de contexto", "custo fixo de contexto", "overhead de rules", "overhead dos agents", "impacto do MCP no contexto", "espaco no context window", "quanto cabe no context window"
development
Coleta e organiza informacao tecnica multi-fonte antes de escrever docs, PRDs, ADRs ou artigos. Busca em: docs oficiais, GitHub (repos + issues), Stack Overflow, papers e blogs de referencia. Ranqueia fontes por autoridade (oficial 40% + recencia 30% + profundidade 20% + comunidade 10%). Output: memory/research/<slug>.md pronto para alimentar skill 10 (documenter), skill 01 (po-feature-spec), skill 26 (prompt-engineer) ou skill 41 (blog-publisher). Trigger em: "pesquisa tecnica", "levanta informacao", "coleta docs", "busca referencias", "preciso de fontes", "research antes de escrever", "levanta o que existe sobre", "benchmark de solucoes", "o que existe sobre X", "quero entender o estado da arte", "compara abordagens", "levanta referencias", "faz um research de", "coleta fontes sobre", "pesquisa sobre", "quero saber o que existe de", "monta um dossie tecnico", "background tecnico", "due diligence tecnica", "levantamento de alternativas".