Adoption

Agent Skills are supported by leading AI development tools.

VS Code Gemini CLI GitHub Goose Amp Cursor Claude Code Letta OpenCode Claude OpenAI Codex Factory VS Code Gemini CLI GitHub Goose Amp Cursor Claude Code Letta OpenCode Claude OpenAI Codex Factory

felvieira/post-deploy-canary-monitor

Name: post-deploy-canary-monitor
Author: felvieira

skills/46-post-deploy-canary-monitor/SKILL.md

npx skillsauth add felvieira/claude-skills-fv post-deploy-canary-monitor

Clean

TrivyContainer and dependency vulnerability scanner

Clean

SemgrepStatic code analysis for vulnerabilities

Clean

mcp-scan (Snyk)Model Context Protocol security validation

Skipped

Snyk (dep)Open source security scanning

Skipped

Socket.devSupply chain security analysis

Skipped

VirusTotalMulti-engine malware detection

Skipped

CrowdStrikeAdvanced threat intelligence

Skipped

OSV-ScannerOpen Source Vulnerability database check

Skipped

OWASP Dep-Check

Post-Deploy Canary Monitor — Vigia Producao Sem Dormir

Inspiracao: gstack/canary (MIT, Garry Tan). Adaptado: foca em pos-deploy (depois do 100% rollout), enquanto skill 43 cobre durante o rollout gradual.

Diferenca vs skill 43 (canary-deployment)

| | Skill 43 canary-deployment | Skill 45 post-deploy-canary-monitor (esta) | |------------------|----------------------------|--------------------------------------------| | Momento | DURANTE o rollout (0% → 100%) | DEPOIS do rollout completar (100% live) | | Decisao | Promover ou abortar deploy | Manter producao ou rollback | | Mecanismo | Traffic split, feature flag, blue-green | Polling de metricas + screenshot diff | | Termina quando | 100% completo OU abortou | Janela de observacao expirou OK | | Escalacao | (proprio rollback do canary) | Chama skill 43 (rollback) ou skill 24 (release-manager) |

Quando Usar

deploy acabou de fechar 100% — primeiras 2-24h de vigilancia
mudanca grande (migration, refactor, framework upgrade) que pode regredir silencioso
sem observability robusta no projeto (esta skill cobre o basico)
producao critica onde "deploy passou no canary 5%" nao garante "100% e saudavel"

Quando NAO Usar

voce ja tem Datadog/Sentry/NewRelic com alertas — use o sistema existente
deploy trivial (config change, doc) sem risco
ainda esta no rollout — use skill 43

Governanca Global

Segue GLOBAL.md, policies/verification-before-completion.md (a verificacao continua apos deploy fechar), policies/handoffs.md (escalacao pra skill 43), policies/observability-trace-tags.md.

Gate contra constituicao

Quando memory/constitution.md define SLOs no eixo Performance/Reliability:

baseline pre-deploy precisa estar capturado antes desta skill comecar
threshold de abort = SLO violado + N% margem
error budget restante deve cobrir esta janela de observacao

Inputs

url: https://prod.exemplo.com
baseline:
  metrics: ./baseline/metrics-pre-deploy.json
  screenshots: ./baseline/screenshots/
thresholds:
  console_errors_per_min: 0          # zero tolerancia
  lcp_regression_pct: 20              # >20% pior que baseline = abort
  cls_regression_pct: 25
  screenshot_diff_pct: 5              # >5% de pixels diferentes em paginas-chave
  status_5xx_pct: 1                   # >1% de respostas 5xx
window:
  interval: 15m
  duration: 24h
  abort_after_consecutive_failures: 2
escalation:
  on_abort: skill-43-rollback         # ou comando manual
  notify: <slack-channel | email>

Protocolo

1. Captura baseline (pre-deploy)

Se nao houver baseline ainda, capturar antes do deploy:

# Metricas
curl -s "$URL/metrics" > baseline/metrics-pre-deploy.json

# Screenshots de paginas-chave (Playwright via anthropic-skills:webapp-testing)
# - homepage
# - 2-3 paginas mais traficadas
# - 1 fluxo critico (checkout, login, search)

2. Loop de vigilancia (pos-deploy)

A cada interval (default 15min), por ate duration (default 24h):

Coletar metricas atuais — mesmo endpoint do baseline
Tirar screenshots atuais — mesmas paginas
Comparar contra baseline:
- delta de console errors (qualquer >0 = alerta imediato)
- delta de LCP/CLS (>threshold = alerta)
- diff de screenshot (>threshold pixels = alerta)
- taxa de 5xx (>threshold = alerta)
Registrar em docs/canary-runs/YYYY-MM-DD-<release>/timeline.jsonl:

{"t":"15:00","status":"ok","lcp_delta":-2,"errors":0,"screenshot_diff":0.4}
{"t":"15:15","status":"ok","lcp_delta":+5,"errors":0,"screenshot_diff":0.6}
{"t":"15:30","status":"alert","lcp_delta":+22,"errors":3,"screenshot_diff":7.2,"reason":"lcp_regression+errors"}

Decidir:
- tudo verde → continuar ate fim da janela → mark healthy
- 1 alerta → log e continuar (false-positive comum)
- 2 alertas consecutivos → escalar abort

3. Escalacao em abort

Ao detectar 2 falhas consecutivas:

Registrar evento detalhado em docs/canary-runs/.../abort.md
Notificar canal configurado (slack/email)
Sugerir:
- opcao A: /run-program rollback ou skill 43 reverse
- opcao B: investigar (skill 06 + skill 34) — se nao for security/perf, hotfix
- opcao C: user override (false positive confirmado)

NAO faz rollback automatico por default. Producao = decisao humana, salvo override explicito no input.

4. Saida saudavel

Ao final da janela sem aborts:

Mark release healthy em docs/canary-runs/.../verdict.md
Atualizar docs/releases/<versao>.md com link pro report
Sugerir promover baseline atual como novo baseline canonico

Output canonico

docs/canary-runs/2026-05-27-v2.19.0/
├── input.yaml           # config usada
├── baseline/
│   ├── metrics.json
│   └── screenshots/
├── timeline.jsonl       # 1 linha por check
├── abort.md (se houve)  # detalhes do incidente
└── verdict.md           # healthy | rolled-back | aborted

Handoffs

escalacao: skill 43 (canary-deployment reverso) ou skill 24 (release-manager)
investigacao pos-abort: skill 06 (security) + skill 34 (static-analysis) + skill debugger
registro pos-saudavel: skill 24 (release-manager) atualiza changelog com badge "verified"

Dependencias

anthropic-skills:webapp-testing (Playwright) — captura screenshots
skill 20 (observability-sre) — define o que metrificar
skill 43 (canary-deployment) — escalacao de rollback
skill 30 (cost-tracker) — esta skill consome recursos durante a janela

Anti-padroes

❌ Rollback automatico sem decisao humana (default) — producao nao se rolla sozinha
❌ Janela infinita — sempre duration finito (24h-7d max)
❌ Ignorar console error porque "e so um warning" — qualquer aumento = sinal
❌ Sem baseline pre-deploy — comparacao impossivel
❌ Screenshot diff sem mascarar areas dinamicas (timestamps, randoms) — gera false positive
❌ Esta skill substituir observability profissional — ela cobre o gap, nao o ouro padrao

felvieira/post-deploy-canary-monitor

skills/46-post-deploy-canary-monitor/SKILL.md

Vigia producao apos deploy fechar, comparando metricas e screenshots contra baseline pre-deploy. Detecta regressao silenciosa (console errors, perf drop, broken pages) nas primeiras horas/dias. Diferente de skill 43 (canary-deployment) que faz promocao gradual durante o deploy: esta skill comeca QUANDO o deploy ja fechou 100% e fica vigiando ate confirmar que esta saudavel ou escalar pra rollback. Trigger em: "monitor producao", "monitora producao", "monitora se", "watch deploy", "watch production", "post-deploy check", "pos-deploy", "depois do deploy", "depois do rollout", "vigiar producao", "regressao silenciosa", "deploy passou mas", "verificar producao", "deploy stuck", "production health check", "screenshot diff", "lcp regrediu", "baseline comparativo".

18 stars

testing

Updated May 28, 2026

$ install --global

skillsauth

npx skillsauth add felvieira/claude-skills-fv post-deploy-canary-monitor

Install this skill globally with one command. Works with Claude Code, Cursor, and Windsurf.

Security Scan Results

3 of 9 scanners reported clean

Some scanners were skipped, did not run, or reported a non-clean status. Review each row below.

Scanners Passed

Scanners in report

Clean

TrivyContainer and dependency vulnerability scanner

95%

Clean

SemgrepStatic code analysis for vulnerabilities

95%

Clean

mcp-scan (Snyk)Model Context Protocol security validation

95%

Skipped

Snyk (dep)Open source security scanning

50%

Skipped

Socket.devSupply chain security analysis

50%

Skipped

VirusTotalMulti-engine malware detection

50%

Skipped

CrowdStrikeAdvanced threat intelligence

50%

Skipped

OSV-ScannerOpen Source Vulnerability database check

50%

Skipped

OWASP Dep-Check

50%

Last scanned: May 28, 2026, 3:22 AM231.8s1 file scanned

SKILL.md

name:: post-deploy-canary-monitor
description:: |
Diferente de skill 43 (canary-deployment) que faz promocao gradual durante o deploy:: esta skill
Trigger em:: monitor producao", "monitora producao", "monitora se", "watch deploy",
argument-hint:: [--url=https://prod.exemplo] [--baseline=path] [--interval=15m] [--duration=24h]
allowed-tools:: Read, Write, Bash, Glob

Post-Deploy Canary Monitor — Vigia Producao Sem Dormir

Inspiracao: gstack/canary (MIT, Garry Tan). Adaptado: foca em pos-deploy (depois do 100% rollout), enquanto skill 43 cobre durante o rollout gradual.

Diferenca vs skill 43 (canary-deployment)

Quando Usar

deploy acabou de fechar 100% — primeiras 2-24h de vigilancia
mudanca grande (migration, refactor, framework upgrade) que pode regredir silencioso
sem observability robusta no projeto (esta skill cobre o basico)
producao critica onde "deploy passou no canary 5%" nao garante "100% e saudavel"

Quando NAO Usar

voce ja tem Datadog/Sentry/NewRelic com alertas — use o sistema existente
deploy trivial (config change, doc) sem risco
ainda esta no rollout — use skill 43

Governanca Global

Gate contra constituicao

Quando memory/constitution.md define SLOs no eixo Performance/Reliability:

baseline pre-deploy precisa estar capturado antes desta skill comecar
threshold de abort = SLO violado + N% margem
error budget restante deve cobrir esta janela de observacao

Inputs

url: https://prod.exemplo.com
baseline:
  metrics: ./baseline/metrics-pre-deploy.json
  screenshots: ./baseline/screenshots/
thresholds:
  console_errors_per_min: 0          # zero tolerancia
  lcp_regression_pct: 20              # >20% pior que baseline = abort
  cls_regression_pct: 25
  screenshot_diff_pct: 5              # >5% de pixels diferentes em paginas-chave
  status_5xx_pct: 1                   # >1% de respostas 5xx
window:
  interval: 15m
  duration: 24h
  abort_after_consecutive_failures: 2
escalation:
  on_abort: skill-43-rollback         # ou comando manual
  notify: <slack-channel | email>

Protocolo

1. Captura baseline (pre-deploy)

Se nao houver baseline ainda, capturar antes do deploy:

# Metricas
curl -s "$URL/metrics" > baseline/metrics-pre-deploy.json

# Screenshots de paginas-chave (Playwright via anthropic-skills:webapp-testing)
# - homepage
# - 2-3 paginas mais traficadas
# - 1 fluxo critico (checkout, login, search)

2. Loop de vigilancia (pos-deploy)

A cada interval (default 15min), por ate duration (default 24h):

Coletar metricas atuais — mesmo endpoint do baseline
Tirar screenshots atuais — mesmas paginas
Comparar contra baseline:
- delta de console errors (qualquer >0 = alerta imediato)
- delta de LCP/CLS (>threshold = alerta)
- diff de screenshot (>threshold pixels = alerta)
- taxa de 5xx (>threshold = alerta)
Registrar em docs/canary-runs/YYYY-MM-DD-<release>/timeline.jsonl:

{"t":"15:00","status":"ok","lcp_delta":-2,"errors":0,"screenshot_diff":0.4}
{"t":"15:15","status":"ok","lcp_delta":+5,"errors":0,"screenshot_diff":0.6}
{"t":"15:30","status":"alert","lcp_delta":+22,"errors":3,"screenshot_diff":7.2,"reason":"lcp_regression+errors"}

Decidir:
- tudo verde → continuar ate fim da janela → mark healthy
- 1 alerta → log e continuar (false-positive comum)
- 2 alertas consecutivos → escalar abort

3. Escalacao em abort

Ao detectar 2 falhas consecutivas:

Registrar evento detalhado em docs/canary-runs/.../abort.md
Notificar canal configurado (slack/email)
Sugerir:
- opcao A: /run-program rollback ou skill 43 reverse
- opcao B: investigar (skill 06 + skill 34) — se nao for security/perf, hotfix
- opcao C: user override (false positive confirmado)

NAO faz rollback automatico por default. Producao = decisao humana, salvo override explicito no input.

4. Saida saudavel

Ao final da janela sem aborts:

Mark release healthy em docs/canary-runs/.../verdict.md
Atualizar docs/releases/<versao>.md com link pro report
Sugerir promover baseline atual como novo baseline canonico

Output canonico

docs/canary-runs/2026-05-27-v2.19.0/
├── input.yaml           # config usada
├── baseline/
│   ├── metrics.json
│   └── screenshots/
├── timeline.jsonl       # 1 linha por check
├── abort.md (se houve)  # detalhes do incidente
└── verdict.md           # healthy | rolled-back | aborted

Handoffs

escalacao: skill 43 (canary-deployment reverso) ou skill 24 (release-manager)
investigacao pos-abort: skill 06 (security) + skill 34 (static-analysis) + skill debugger
registro pos-saudavel: skill 24 (release-manager) atualiza changelog com badge "verified"

Dependencias

anthropic-skills:webapp-testing (Playwright) — captura screenshots
skill 20 (observability-sre) — define o que metrificar
skill 43 (canary-deployment) — escalacao de rollback
skill 30 (cost-tracker) — esta skill consome recursos durante a janela

Anti-padroes

❌ Rollback automatico sem decisao humana (default) — producao nao se rolla sozinha
❌ Janela infinita — sempre duration finito (24h-7d max)
❌ Ignorar console error porque "e so um warning" — qualquer aumento = sinal
❌ Sem baseline pre-deploy — comparacao impossivel
❌ Screenshot diff sem mascarar areas dinamicas (timestamps, randoms) — gera false positive
❌ Esta skill substituir observability profissional — ela cobre o gap, nao o ouro padrao

Related Skills

felvieira/po-feature-spec

testing

VerifiedTrustedCommunity

Skill do Product Owner para especificação de features. Use quando precisar definir requisitos de negócio, escrever user stories, critérios de aceitação, priorização de backlog, ou qualquer documento de especificação de produto. Inclui fundamento de negócio para discovery: validação de hipótese, problema vs. necessidade, MVP, modelo de monetização e métricas pirata (AARRR) como input da spec. Trigger em: "nova feature", "especificação", "user story", "requisito", "backlog", "PO", "definir escopo", "critério de aceitação", "MVP", "roadmap", "validação de hipótese", "discovery", "monetização", "pricing", "product-market fit", "métricas AARRR".

20SKILL.mdUpdated Apr 4, 2026

felvieira/po-feature-spec

felvieira/41-blog-publisher

development

VerifiedTrustedCommunity

Skill compositora que pega texto/assunto e gera post de blog HTML completo no repo {blog_repo_path} ({github_user_repo_url}), com imagens (via skill 17 fal.ai ou skill 42 Playwright screenshot), commit+push automático, retorna URL pública via GitHub Pages. Trigger em: "post no blog", "publicar post", "escrever post", "blog post", "publish blog", "gera post", "criar post", "novo post no meu blog".

19SKILL.mdUpdated May 25, 2026

felvieira/41-blog-publisher

felvieira/context-budget

tools

VerifiedTrustedCommunity

Audita o peso de contexto carregado na sessão — CLAUDE.md, agents, MCP descriptions, rules ativas, skills invocadas e histórico acumulado. Estima tokens por componente, reporta headroom disponível e emite alertas de overflow. Distinto do cost-tracker (skill 30) que rastreia tokens gastos em completions runtime. Trigger em: "contexto inchado", "context overflow", "quanto contexto estou usando", "peso do contexto", "context budget", "tokens carregados", "sessao lenta", "respostas degradadas", "headroom de contexto", "custo fixo de contexto", "overhead de rules", "overhead dos agents", "impacto do MCP no contexto", "espaco no context window", "quanto cabe no context window"

18SKILL.mdUpdated May 29, 2026

felvieira/context-budget

felvieira/research-prep

development

VerifiedTrustedCommunity

Coleta e organiza informacao tecnica multi-fonte antes de escrever docs, PRDs, ADRs ou artigos. Busca em: docs oficiais, GitHub (repos + issues), Stack Overflow, papers e blogs de referencia. Ranqueia fontes por autoridade (oficial 40% + recencia 30% + profundidade 20% + comunidade 10%). Output: memory/research/<slug>.md pronto para alimentar skill 10 (documenter), skill 01 (po-feature-spec), skill 26 (prompt-engineer) ou skill 41 (blog-publisher). Trigger em: "pesquisa tecnica", "levanta informacao", "coleta docs", "busca referencias", "preciso de fontes", "research antes de escrever", "levanta o que existe sobre", "benchmark de solucoes", "o que existe sobre X", "quero entender o estado da arte", "compara abordagens", "levanta referencias", "faz um research de", "coleta fontes sobre", "pesquisa sobre", "quero saber o que existe de", "monta um dossie tecnico", "background tecnico", "due diligence tecnica", "levantamento de alternativas".

18SKILL.mdUpdated May 29, 2026

felvieira/research-prep

Download

For Claude Desktop. Download once, then upload the file in the app — no terminal needed.

Need help? View full Cowork setup guide →

Install manually

Choose your platform

# Clone the repo
git clone https://github.com/felvieira/claude-skills-fv.git

# Copy into Claude Code skills folder (global)
cp -r claude-skills-fv/skills/46-post-deploy-canary-monitor ~/.claude/skills/

Claude Code Skills — official skills path docs.

Repository

felvieira/claude-skills-fv

18 stars

Compatible with

Claude Code

OpenAI Codex CLI

ChatGPT