skills/sre-sla-impact-calculator/SKILL.md
基於 SLA/SLO 量化評估事故影響的計算模型與業務影響矩陣。適用於「SLA 影響」、「SLO 違反」、「影響評估」、「營收損失估算」、「Error Budget」、「可用性計算」、「事故成本評估」等量化事故業務影響的任務。強化 impact-assessor 的評估能力。注意:事故原因分析與改善規劃不在此技能範圍內。
npx skillsauth add vincent119/ai-rules-kit sre-sla-impact-calculatorInstall this skill globally with one command. Works with Claude Code, Cursor, and Windsurf.
3 of 9 scanners reported clean
Some scanners were skipped, did not run, or reported a non-clean status. Review each row below.
量化衡量並報告事故業務影響的框架。
sre-incident-postmortem 技能使用以下輸入會啟動此技能:
sre-incident-postmortem — 完整事故事後分析流程,此技能為其影響評估階段的延伸sre-documentation-generation — 若需要定義或審查 SLO 目標、建立 Error Budget 政策,使用此技能的 SLO-DEFINITION 範本實際使用時常遇到數據缺失,依以下順序降級估算:
| 缺少資料 | 降級方式 | |---------|---------| | 精確停機時間 | 用告警觸發時間到恢復確認時間估算,標記為 Estimated | | 受影響用戶數 | 用流量下降比例 × 活躍用戶數估算 | | 每分鐘交易額 | 用月營收 ÷ 月總分鐘數估算 | | SLA 合約條款 | 使用業界標準(99.9% SLO,違反退 25%)作為參考基準 | | 聲譽影響數據 | 僅記錄定性描述,不強制量化 |
所有估算值必須在報告中明確標注 [估算],並說明估算依據。
SLI(Service Level Indicator):量測指標
例:請求成功率 = 成功請求數 / 總請求數
SLO(Service Level Objective):內部目標
例:請求成功率 >= 99.95%(30 天基準)
SLA(Service Level Agreement):對外合約
例:可用性 < 99.9% → 退還月費 10% 信用點數
| 可用性 | 年停機時間 | 月停機時間 | 週停機時間 | 日停機時間 | |--------|-----------|-----------|-----------|-----------| | 99% | 3d 15h | 7h 18m | 1h 41m | 14m 24s | | 99.5% | 1d 19h | 3h 39m | 50m 24s | 7m 12s | | 99.9% | 8h 46m | 43m 50s | 10m 5s | 1m 26s | | 99.95% | 4h 23m | 21m 55s | 5m 2s | 43s | | 99.99% | 52m 36s | 4m 23s | 1m | 8.6s | | 99.999% | 5m 16s | 26s | 6s | 0.86s |
月 Error Budget(秒)= 月總秒數 × (1 - SLO)
範例(SLO = 99.9%):
月總秒數 = 30 × 24 × 3600 = 2,592,000 秒
月 Error Budget = 2,592,000 × 0.001 = 2,592 秒(43.2 分鐘)
事故消耗 = 停機時間 / 月 Error Budget × 100%
範例:停機 30 分鐘 = 1,800 秒
消耗比例 = 1,800 / 2,592 = 69.4%
| 剩餘比例 | 狀態 | 建議行動 | |---------|------|---------| | > 50% | 🟢 GREEN | 正常,可繼續功能開發 | | 25%~50% | 🟡 YELLOW | 注意,減少高風險部署 | | 0%~25% | 🟠 ORANGE | 警告,暫停非必要部署 | | < 0% | 🔴 RED | 違反 SLO,凍結功能部署 |
| 類別 | 計算方式 | 說明 | |------|---------|------| | 受影響用戶總數 | 活躍用戶 × 影響比例 | 事故期間的活躍用戶 | | 完全中斷 | 無法使用任何功能 | 最嚴重影響 | | 部分影響 | 核心功能受限 | 中等影響 | | 效能降級 | 功能可用但緩慢 | 輕微影響 |
| 類別 | 數量 | 比例 | 備註 | |------|------|------|------| | 受影響用戶總數 | 50,000 | 15% | — | | 完全中斷 | 30,000 | 60% | 無法付款 | | 部分影響 | 20,000 | 40% | 僅能瀏覽 |
直接營收損失 = 每分鐘平均交易額 × 停機分鐘數 × 轉換率
範例:
每分鐘平均交易額 = $500
停機時間 = 30 分鐘
轉換率損失 = 80%(部分用戶會重試)
直接損失 = $500 × 30 × 0.8 = $12,000
| 項目 | 最佳情境 | 預期情境 | 最差情境 | 估算依據 | |------|---------|---------|---------|---------| | 直接營收損失 | $5K | $8K | $12K | 基於同期平均交易量 | | 機會成本 | $2K | $5K | $10K | 估算用戶流失 | | 補償成本 | $0 | $1K | $3K | 預期優惠券/信用點數發放 | | 合計 | $7K | $14K | $25K | — |
| 月可用性 | 信用退款比例 | |---------|------------| | 99.9% ~ 99.99% | 10% | | 99.0% ~ 99.9% | 25% | | < 99.0% | 50% |
月費:$10,000
SLO 目標:99.9%(月允許停機:43.8 分鐘)
實際停機:90 分鐘
月可用性:99.79%(違反 SLO)
信用退款 = $10,000 × 25% = $2,500
| 等級 | 標準 | 顏色 | |------|------|------| | SEV-1 | 核心服務完全中斷,影響 > 20% 用戶 | 🔴 RED | | SEV-2 | 核心功能嚴重降級,影響 5%~20% 用戶 | 🟠 ORANGE | | SEV-3 | 非核心功能受影響,影響 < 5% 用戶 | 🟡 YELLOW | | SEV-4 | 輕微問題,有 Workaround | 🟢 GREEN |
# 影響評估
## 影響摘要
- **整體影響等級**:RED 嚴重 / YELLOW 中等 / GREEN 輕微
- **影響持續時間**:Xh Xm
- **受影響用戶**:N(佔總用戶 X%)
## 用戶影響
[表格]
## 營收影響
[三情境表格]
## SLA/SLO 影響
| 指標 | SLO 目標 | 本月實際 | 本次事故影響 | 剩餘 Error Budget |
## 聲譽影響
| 管道 | 反應 | 嚴重度 | 需要回應 |
## 營運成本
| 項目 | 資源 | 成本估算 |
## 給改善規劃員的備註
- [最高影響區域與需立即改善的項目]
| 管道 | 監控指標 | 嚴重度判斷 | |------|---------|-----------| | Twitter/X | 抱怨推文數、Trending | > 100 則 = YELLOW,> 1000 則 = RED | | 客服中心 | 工單數量、等待時間 | 較平均增加 > 200% = RED | | App Store | 評分變化、負評數 | 評分下降 > 0.5 = RED | | 媒體報導 | 新聞提及數 | 主流媒體報導 = RED |
research
根因分析(RCA)方法論詳細指南。提供 5 Whys、Fishbone 圖、Fault Tree Analysis、變更分析等結構化 RCA 技術,以及認知偏誤防範清單。適用於「根因分析」、「RCA」、「5 Whys」、「魚骨圖」、「Fault Tree」、「原因分析方法論」、「變更分析」等事故原因分析任務。強化 root-cause-investigator 的分析能力。注意:時間軸重建與改善規劃不在此技能範圍內。
testing
事故事後分析(Postmortem)完整流程。協調 7 個執行階段:資訊收集 → 時間軸重建 → 根因分析 → 影響評估 → 改善規劃 → 報告審查 → 整合報告,最終產出完整的 Postmortem 報告。適用於「寫事故報告」、「post-incident 分析」、「RCA 報告」、「事故時間軸整理」、「建立改善措施」等請求。注意:即時 Incident Response(on-call)、監控系統設定、告警配置不在此技能範圍內。
content-media
投影片版面模式庫。提供 20 種投影片類型的最佳版面配置、格線系統、色彩與字型設計 Token。適用於「投影片版面」、「Slide Layout」、「設計系統」、「格線」、「字型」、「色彩規範」等投影片視覺設計任務。強化 visual-designer 的設計能力。注意:PPT/Keynote 檔案直接輸出不在此技能範圍內。
content-media
簡報設計完整製作流程。協調 5 個製作階段:故事結構 → 資訊設計 → 視覺設計 → 講者備稿 → 品質審查,最終產出完整的簡報套件。適用於「製作簡報」、「Presentation 規劃」、「PPT 製作」、「Slide Deck 設計」、「簡報故事線」、「投影片設計」等請求。注意:PowerPoint/Keynote 檔案直接輸出、投影片動畫設定不在此技能範圍內。