Adoption

Agent Skills are supported by leading AI development tools.

VS Code Gemini CLI GitHub Goose Amp Cursor Claude Code Letta OpenCode Claude OpenAI Codex Factory VS Code Gemini CLI GitHub Goose Amp Cursor Claude Code Letta OpenCode Claude OpenAI Codex Factory

tarrragon/bulk-evaluate

Name: bulk-evaluate
Author: tarrragon

skills/bulk-evaluate/SKILL.md

npx skillsauth add tarrragon/claude bulk-evaluate

Clean

TrivyContainer and dependency vulnerability scanner

Clean

SemgrepStatic code analysis for vulnerabilities

Clean

mcp-scan (Snyk)Model Context Protocol security validation

Skipped

Snyk (dep)Open source security scanning

Skipped

Socket.devSupply chain security analysis

Skipped

VirusTotalMulti-engine malware detection

Skipped

CrowdStrikeAdvanced threat intelligence

Skipped

OSV-ScannerOpen Source Vulnerability database check

Skipped

OWASP Dep-Check

子任務拆分與 Context 卸載工具

例外情況的批次計算公式: references/context-budget-formula.md

核心概念

問題：主線程的 context 有限。當一個任務需要讀取大量資料（N 個檔案、N 個模組、N 個報告），全部由主線程處理會溢出 context。

解法：把「讀取 + 分析 + 記錄」整包卸載給 Agent，主線程只負責拆分和統計。

關鍵設計：Ticket 既是任務指派，也是分析報告的載體。Agent 把結論直接寫入子 Ticket，主線程不接收完整內容 — 只看 Ticket 狀態和摘要統計。

傳統模式（主線程 context 溢出）:
  主線程讀取 N 個檔案 → 分析 → 產出報告 → context 爆炸

卸載模式（本 Skill）:
  主線程建立 N 個子 Ticket → 派發 Agent → Agent 寫入 Ticket → 主線程只看統計

適用場景

| 場景 | 子任務單位 | 每個子 Ticket 的內容 | |------|-----------|-------------------| | Agent/Skill 合規掃描 | 1 個定義檔案 | 評估結論 + 具體問題 | | 規則一致性檢查 | 1 個規則檔案 | 衝突發現 + 建議修正 | | 測試品質批量審查 | 1 個測試檔案/目錄 | 品質評分 + 改善建議 | | 大型重構影響分析 | 1 個模組/目錄 | 影響範圍 + 遷移方案 | | 多模組效能掃描 | 1 個效能熱點 | 瓶頸分析 + 優化建議 |

通用判斷：只要任務可以表述為「對 N 個獨立單位各做一次相同的分析」，就適用本 Skill。

與 `/parallel-evaluation` 的區別

| 維度 | /parallel-evaluation | /bulk-evaluate | |------|----------------------|-----------------| | 並行軸 | N 個視角 x 1 組目標 | 1 個標準 x N 個單位 | | 產出物 | 彙整報告（回到主線程） | N 個子 Ticket（不回主線程） | | Context 影響 | 主線程接收彙整結果 | 主線程只看統計摘要 | | 目的 | 多角度快速評估 | 批量處理 + context 卸載 |

核心流程（5 步）

Step 1: 識別子任務單位

確定每個子任務的處理單位和分析標準。

問自己：
1. 這個任務可以拆成幾個「對 X 做同一件事」的子任務？
2. 每個子任務的輸入是什麼？（一個檔案？一個模組？一個報告？）
3. 每個子任務的產出寫在哪？（Ticket 的哪個欄位？）
4. 分析標準是什麼？（參考文件？檢查清單？評估維度？）

Step 2: 建立 Ticket 結構

/ticket create → 父 Ticket（匯總任務，type: ANA）
  |-- /ticket create --parent → 子 Ticket 1（單位 A 的分析）
  |-- /ticket create --parent → 子 Ticket 2（單位 B 的分析）
  └── ...

每個子 Ticket 的驗收條件統一為:

[ ] 已讀取目標內容
[ ] 已對照分析標準完成檢查
[ ] 結論已寫入本 Ticket
[ ] 具體發現已列出（如有）

Step 3: 派發策略（單一職責原則）

預設: 1 個子任務 = 1 個 Agent

59 個評估目標 → 59 個獨立 Agent
每個 Agent 只負責 1 個目標

為什麼不批次處理:

| 維度 | 批次處理 | 1:1 派發 | |------|---------|---------| | 認知負擔 | Agent 需同時理解多個目標 | 只專注一個目標 | | 判斷品質 | 目標間資訊互相干擾 | 零干擾，判斷最精準 | | 失敗隔離 | 一批失敗影響多個子任務 | 單點失敗不擴散 |

這就是 context 卸載的核心目的：讓每個 process 的任務目標清晰明確，避免額外資訊干擾判斷。

例外：僅當平台限制無法派發足夠 Agent 時，才參考 references/context-budget-formula.md 計算合理批次大小。

Step 4: 並行派發

每個 Agent 的 prompt 包含：

分析標準（參考文件路徑）
負責的 1 個子 Ticket（ID + 對應的輸入內容路徑）
產出要求（結論直接寫入子 Ticket）

Agent 不需要知道：其他目標的存在、總共有幾個子任務、其他 Agent 的結論。

Agent 類型選擇:

| 需要寫入 Ticket | 推薦 Agent | |----------------|-----------| | 是 | general-purpose | | 否（只讀分析） | Explore / Plan |

Step 5: 彙整統計

所有 Agent 完成後，主線程只做統計（不讀取子 Ticket 全文）：

## 批量評估結果

**父 Ticket**: {ID}  **子任務總數**: {N}  **完成**: {M}/{N}

| 結論類別 | 數量 | 佔比 |
|---------|------|------|
| [類別 A] | X | X% |
| [類別 B] | X | X% |

### 需關注的子任務
| # | 子 Ticket | 結論 | 簡要 |
|---|----------|------|------|

更新父 Ticket 狀態，流程結束。

執行範例

範例: 59 個 Agent/Skill 合規掃描

Step 1: 子任務單位 = 每個 agent/skill 定義檔案
        分析標準 = design-guide (~25KB)
Step 2: 父 Ticket + 59 個子 Ticket
Step 3: 預設 1:1 → 59 個獨立 Agent
Step 4: 並行派發 59 個 general-purpose Agent，各處理 1 個子 Ticket
        每個 Agent 只讀取: design-guide + 自己負責的 1 個定義檔案
Step 5: 統計 59 個子 Ticket 結論 → 更新父 Ticket

主線程 context 消耗: 只有 Step 2（建 Ticket）和 Step 5（統計），不讀取 59 個定義檔案。 每個 Agent context 消耗: ~25KB 標準 + ~17KB 目標 = ~42KB，遠低於 context 上限。

tarrragon/bulk-evaluate

skills/bulk-evaluate/SKILL.md

子任務拆分與 Context 卸載工具。將可拆分的大型任務分成 N 個子 Ticket，各由 Agent 獨立執行，結論直接寫入 Ticket 不回報主線程。Use for: 批量檔案評估, 大型審查任務拆分, 任何需要讀取大量資料但結果可落地到 Ticket 的任務

1 stars

data-ai

Updated Apr 18, 2026

$ install --global

skillsauth

npx skillsauth add tarrragon/claude bulk-evaluate

Install this skill globally with one command. Works with Claude Code, Cursor, and Windsurf.

Security Scan Results

3 of 9 scanners reported clean

Some scanners were skipped, did not run, or reported a non-clean status. Review each row below.

Scanners Passed

Scanners in report

Clean

TrivyContainer and dependency vulnerability scanner

95%

Clean

SemgrepStatic code analysis for vulnerabilities

95%

Clean

mcp-scan (Snyk)Model Context Protocol security validation

95%

Skipped

Snyk (dep)Open source security scanning

50%

Skipped

Socket.devSupply chain security analysis

50%

Skipped

VirusTotalMulti-engine malware detection

50%

Skipped

CrowdStrikeAdvanced threat intelligence

50%

Skipped

OSV-ScannerOpen Source Vulnerability database check

50%

Skipped

OWASP Dep-Check

50%

Last scanned: Apr 18, 2026, 3:55 AM55.1s2 files scanned

SKILL.md

name:: bulk-evaluate
description:: 子任務拆分與 Context 卸載工具。將可拆分的大型任務分成 N 個子 Ticket，各由 Agent 獨立執行，結論直接寫入 Ticket 不回報主線程。Use for: 批量檔案評估, 大型審查任務拆分, 任何需要讀取大量資料但結果可落地到 Ticket 的任務

子任務拆分與 Context 卸載工具

例外情況的批次計算公式: references/context-budget-formula.md

核心概念

問題：主線程的 context 有限。當一個任務需要讀取大量資料（N 個檔案、N 個模組、N 個報告），全部由主線程處理會溢出 context。

解法：把「讀取 + 分析 + 記錄」整包卸載給 Agent，主線程只負責拆分和統計。

關鍵設計：Ticket 既是任務指派，也是分析報告的載體。Agent 把結論直接寫入子 Ticket，主線程不接收完整內容 — 只看 Ticket 狀態和摘要統計。

傳統模式（主線程 context 溢出）:
  主線程讀取 N 個檔案 → 分析 → 產出報告 → context 爆炸

卸載模式（本 Skill）:
  主線程建立 N 個子 Ticket → 派發 Agent → Agent 寫入 Ticket → 主線程只看統計

適用場景

通用判斷：只要任務可以表述為「對 N 個獨立單位各做一次相同的分析」，就適用本 Skill。

與 `/parallel-evaluation` 的區別

核心流程（5 步）

Step 1: 識別子任務單位

確定每個子任務的處理單位和分析標準。

問自己：
1. 這個任務可以拆成幾個「對 X 做同一件事」的子任務？
2. 每個子任務的輸入是什麼？（一個檔案？一個模組？一個報告？）
3. 每個子任務的產出寫在哪？（Ticket 的哪個欄位？）
4. 分析標準是什麼？（參考文件？檢查清單？評估維度？）

Step 2: 建立 Ticket 結構

/ticket create → 父 Ticket（匯總任務，type: ANA）
  |-- /ticket create --parent → 子 Ticket 1（單位 A 的分析）
  |-- /ticket create --parent → 子 Ticket 2（單位 B 的分析）
  └── ...

每個子 Ticket 的驗收條件統一為:

[ ] 已讀取目標內容
[ ] 已對照分析標準完成檢查
[ ] 結論已寫入本 Ticket
[ ] 具體發現已列出（如有）

Step 3: 派發策略（單一職責原則）

預設: 1 個子任務 = 1 個 Agent

59 個評估目標 → 59 個獨立 Agent
每個 Agent 只負責 1 個目標

為什麼不批次處理:

這就是 context 卸載的核心目的：讓每個 process 的任務目標清晰明確，避免額外資訊干擾判斷。

例外：僅當平台限制無法派發足夠 Agent 時，才參考 references/context-budget-formula.md 計算合理批次大小。

Step 4: 並行派發

每個 Agent 的 prompt 包含：

分析標準（參考文件路徑）
負責的 1 個子 Ticket（ID + 對應的輸入內容路徑）
產出要求（結論直接寫入子 Ticket）

Agent 不需要知道：其他目標的存在、總共有幾個子任務、其他 Agent 的結論。

Agent 類型選擇:

| 需要寫入 Ticket | 推薦 Agent | |----------------|-----------| | 是 | general-purpose | | 否（只讀分析） | Explore / Plan |

Step 5: 彙整統計

所有 Agent 完成後，主線程只做統計（不讀取子 Ticket 全文）：

## 批量評估結果

**父 Ticket**: {ID}  **子任務總數**: {N}  **完成**: {M}/{N}

| 結論類別 | 數量 | 佔比 |
|---------|------|------|
| [類別 A] | X | X% |
| [類別 B] | X | X% |

### 需關注的子任務
| # | 子 Ticket | 結論 | 簡要 |
|---|----------|------|------|

更新父 Ticket 狀態，流程結束。

執行範例

範例: 59 個 Agent/Skill 合規掃描

Step 1: 子任務單位 = 每個 agent/skill 定義檔案
        分析標準 = design-guide (~25KB)
Step 2: 父 Ticket + 59 個子 Ticket
Step 3: 預設 1:1 → 59 個獨立 Agent
Step 4: 並行派發 59 個 general-purpose Agent，各處理 1 個子 Ticket
        每個 Agent 只讀取: design-guide + 自己負責的 1 個定義檔案
Step 5: 統計 59 個子 Ticket 結論 → 更新父 Ticket

Related Skills

tarrragon/impeccable

development

VerifiedTrustedCommunity

Use when the user wants to design, redesign, shape, critique, audit, polish, clarify, distill, harden, optimize, adapt, animate, colorize, extract, or otherwise improve a frontend interface. Covers websites, landing pages, dashboards, product UI, app shells, components, forms, settings, onboarding, and empty states. Handles UX review, visual hierarchy, information architecture, cognitive load, accessibility, performance, responsive behavior, theming, anti-patterns, typography, fonts, spacing, layout, alignment, color, motion, micro-interactions, UX copy, error states, edge cases, i18n, and reusable design systems or tokens. Also use for bland designs that need to become bolder or more delightful, loud designs that should become quieter, live browser iteration on UI elements, or ambitious visual effects that should feel technically extraordinary. Not for backend-only or non-UI tasks.

1SKILL.mdUpdated Jun 4, 2026

tarrragon/cc-release-impact-review

development

VerifiedTrustedCommunity

Claude Code release notes 框架影響評估工具。比對 last-reviewed 版本篩出新版本，逐項分類（對框架有幫助 / 需評估 / 無影響 / 不適用），對採用項引導建 ANA + WRAP + spawn 落地。Use when: 執行 /release-notes 看到新版本、定期檢查 CC 更新、評估新功能對專案框架的影響時。Triggers: release notes, release-notes, CC 更新, claude code 更新, 版本更新評估, 新功能評估, 框架影響評估。

1SKILL.mdUpdated Jun 4, 2026

tarrragon/cc-release-impact-review

tarrragon/test-assertion-design

development

VerifiedTrustedCommunity

Assertion design judgment framework for flaky and design-quality issues. Use when writing tests, reviewing assertions, diagnosing flaky tests, or deciding if a timing/float/cache assertion is appropriate. Do NOT use for API syntax or refactoring.

1SKILL.mdUpdated May 27, 2026

tarrragon/test-assertion-design

tarrragon/chrome-extension-mcp-debug

tools

VerifiedTrustedCommunity

Chrome Extension 實機測試與 debug 工作流，以 chrome-devtools-mcp 為核心工具。Use when: (1) 完成功能後實機驗證 / manual test / 試看看 / 跑看看 / verify feature, (2) extension debug / popup 不作動 / content script 不注入 / service worker 報錯 / background 出問題, (3) 安裝 unpacked extension / load unpacked / 載入未封裝, (4) 看 console / 看 network / 看 log / view console / inspect requests, (5) 功能更新後重新載入 extension / rebuild reload / reload extension。涵蓋 Manifest V3 service worker / content script / popup / options page 的 chrome-devtools-mcp 工具呼叫流程。不取代 Puppeteer / Playwright 自動化 E2E（CI 用），定位為開發期手動驗證與 LLM-assisted debug。

1SKILL.mdUpdated May 12, 2026

tarrragon/chrome-extension-mcp-debug

Download

For Claude Desktop. Download once, then upload the file in the app — no terminal needed.

Need help? View full Cowork setup guide →

Install manually

Choose your platform

# Clone the repo
git clone https://github.com/tarrragon/claude.git

# Copy into Claude Code skills folder (global)
cp -r claude/skills/bulk-evaluate ~/.claude/skills/

Claude Code Skills — official skills path docs.

Repository

tarrragon/claude

1 stars

Compatible with

Claude Code

OpenAI Codex CLI

ChatGPT

Adoption

tarrragon/bulk-evaluate

$ install --global

Security Scan Results

SKILL.md

子任務拆分與 Context 卸載工具

核心概念

適用場景

與 /parallel-evaluation 的區別

核心流程（5 步）

Step 1: 識別子任務單位

Step 2: 建立 Ticket 結構

Step 3: 派發策略（單一職責原則）

Step 4: 並行派發

Step 5: 彙整統計

執行範例

範例: 59 個 Agent/Skill 合規掃描

相關文件

Related Skills

tarrragon/impeccable

tarrragon/cc-release-impact-review

tarrragon/test-assertion-design

tarrragon/chrome-extension-mcp-debug

tarrragon/bulk-evaluate

$ install --global

Security Scan Results

SKILL.md

子任務拆分與 Context 卸載工具

核心概念

適用場景

與 /parallel-evaluation 的區別

核心流程（5 步）

Step 1: 識別子任務單位

Step 2: 建立 Ticket 結構

Step 3: 派發策略（單一職責原則）

Step 4: 並行派發

Step 5: 彙整統計

執行範例

範例: 59 個 Agent/Skill 合規掃描

相關文件

Related Skills

tarrragon/impeccable

tarrragon/cc-release-impact-review

tarrragon/test-assertion-design

tarrragon/chrome-extension-mcp-debug

與 `/parallel-evaluation` 的區別

與 `/parallel-evaluation` 的區別