Adoption

Agent Skills are supported by leading AI development tools.

VS Code Gemini CLI GitHub Goose Amp Cursor Claude Code Letta OpenCode Claude OpenAI Codex Factory VS Code Gemini CLI GitHub Goose Amp Cursor Claude Code Letta OpenCode Claude OpenAI Codex Factory

LUAgam/skills/runtime-harness

Name: skills/runtime-harness
Author: LUAgam

skills/runtime-harness/SKILL.md

npx skillsauth add LUAgam/stage-harness skills/runtime-harness

Clean

TrivyContainer and dependency vulnerability scanner

Clean

SemgrepStatic code analysis for vulnerabilities

Clean

mcp-scan (Snyk)Model Context Protocol security validation

Skipped

Snyk (dep)Open source security scanning

Skipped

Socket.devSupply chain security analysis

Skipped

VirusTotalMulti-engine malware detection

Skipped

CrowdStrikeAdvanced threat intelligence

Skipped

OSV-ScannerOpen Source Vulnerability database check

Skipped

OWASP Dep-Check

SKILL: runtime-harness

CLI Bootstrap

在执行任何 harnessctl 命令前，校验环境变量 HARNESSCTL 是否已配置：

test -n "${HARNESSCTL:-}" && test -x "$HARNESSCTL" || {
  echo "ERROR: HARNESSCTL 环境变量未设置或不可执行。请先执行: export HARNESSCTL=/path/to/stage-harness/scripts/harnessctl" >&2
  exit 1
}

运行时 Harness 技能，定义持续控偏规则。在整个 EXECUTE 阶段持续运行，在 5 个检查点介入，确保实现不偏离 spec，证据完整，失败可追溯。

概述

runtime-harness 不是一个单独运行的阶段，而是嵌入到 work/SKILL.md 内循环的控偏层。每个检查点在特定时机触发，发现问题时立即阻断。

5 个检查点

Checkpoint 1 — Preflight（任务开跑前）

时机：每个 task 的 Phase 2（Preflight 校验）

校验内容：

输入上下文完整性：
  - task JSON 可读且字段完整
  - spec 文件存在（.harness/specs/<epic-id>.md）
  - coverage-matrix.json 存在

依赖满足性：
  - task.dependencies 中所有 task_id 状态 = done

工作区状态：
  - git status 输出为 clean（无未追踪/未提交文件）
  - 或有明确的 stash/暂存理由

预算检查：
  - interrupt_budget.remaining > 0（否则需要人工授权）

阻断条件：任一项不满足。

Checkpoint 2 — In-loop Eval（实现过程中漂移检测）

时机：Phase 3 实现阶段，GREEN 步骤完成后

漂移检测（drift detection）：

对比当前实现与 spec 中的约束：

# 读取 spec 中的不变量（invariants）
grep -A5 "## Invariants" .harness/specs/<epic-id>.md

# 读取 task acceptance_criteria
$HARNESSCTL task show <task-id> --json | jq '.acceptance_criteria'

检查：

实现是否超出 task acceptance_criteria 范围？（scope creep）
实现是否与 spec 中的不变量冲突？
是否修改了计划外的文件？（git diff --name-only 对比 task 预期文件列表）

失败计数：每次测试失败（RED→GREEN 步骤）计数 +1，写入 epic state：

"runtime_health": {
  "consecutive_failures": <n>,
  "drift_detected": <bool>,
  "last_smoke_pass": "<iso8601>"
}

证据完整性：验证实现产出了 task evidence 字段要求的所有文件。

阻断条件：

drift_detected = true（实现偏离 spec）
consecutive_failures >= 3

Checkpoint 3 — Task Smoke（每个 task 完成后）

时机：Phase 4 Task Smoke

最小可运行验证：

# 运行 task 相关测试
<test-command> --filter <task-pattern>

# 验证证据文件
for evidence_file in $($HARNESSCTL task show <task-id> --json | jq -r '.evidence | to_entries[].value'); do
  test -f "$evidence_file" || echo "MISSING: $evidence_file"
done

阻断条件：

测试失败
证据文件缺失

通过时：更新 runtime_health.last_smoke_pass。

Checkpoint 4 — Stage Smoke（EXECUTE 出口）

时机：所有 tasks 完成，准备转换到 VERIFY 前

阶段级烟测：

# 运行全量回归测试
<project-test-command>

# 验证所有 receipt 存在
for task_id in $($HARNESSCTL task list <epic-id> --json | jq -r '.[].id'); do
  test -f ".harness/features/<epic-id>/receipts/${task_id}.json" \
    || echo "MISSING RECEIPT: $task_id"
done

# 验证 coverage-matrix 的 mappings 全部有对应 receipt

阻断条件：

回归测试失败（smoke regression）
任何 task 缺少 receipt
coverage-matrix 中的 mapping 没有对应证据

Checkpoint 5 — Auto-Diagnose（失败时自动收集）

时机：任何检查点阻断时自动触发

自动收集信息：

# 1. 代码 diff
git diff HEAD~3..HEAD > .harness/features/<epic-id>/diag/diff-<timestamp>.patch

# 2. 最近测试日志
<test-command> 2>&1 | tail -100 > .harness/features/<epic-id>/diag/test-log-<timestamp>.txt

# 3. 环境摘要
node --version && npm --version && git log -3 --oneline \
  > .harness/features/<epic-id>/diag/env-<timestamp>.txt

输出 triage 报告：

{
  "timestamp": "<iso8601>",
  "checkpoint": "<which-checkpoint>",
  "task_id": "<task-id>",
  "epic_id": "<epic-id>",
  "failure_reason": "<description>",
  "consecutive_failures": <n>,
  "diff_path": "<path>",
  "log_path": "<path>",
  "env_path": "<path>",
  "recommended_action": "local_fix | plan_patch | spec_patch | manual_review"
}

阻断条件汇总

以下任一条件满足时，runtime-harness 立即阻断当前 task 执行：

| 条件 | 来源检查点 | |------|-----------| | 任务目标与 spec 不一致（drift detected） | Checkpoint 2 | | 依赖前置条件未满足 | Checkpoint 1 | | 代码通过实现但未留下可验证 evidence | Checkpoint 3 | | 连续失败超过阈值（3次） | Checkpoint 2 | | 回归烟测失败 | Checkpoint 4 |

状态持久化

runtime-harness 的运行状态持久化到 epic state 的 runtime_health 字段：

# 读取当前 runtime health
$HARNESSCTL state get <epic-id> --json | jq '.runtime_health'

# 手动重置连续失败计数（修复后）
$HARNESSCTL state patch <epic-id> \
  --set runtime_health.consecutive_failures=0 \
  --set runtime_health.drift_detected=false

LUAgam/skills/runtime-harness

skills/runtime-harness/SKILL.md

# SKILL: runtime-harness ## CLI Bootstrap 在执行任何 `harnessctl` 命令前，校验环境变量 `HARNESSCTL` 是否已配置： ```bash test -n "${HARNESSCTL:-}" && test -x "$HARNESSCTL" || { echo "ERROR: HARNESSCTL 环境变量未设置或不可执行。请先执行: export HARNESSCTL=/path/to/stage-harness/scripts/harnessctl" >&2 exit 1 } ``` 运行时 Harness 技能，定义持续控偏规则。在整个 EXECUTE 阶段持续运行，在 5 个检查点介入，确保实现不偏离 spec，证据完整，失败可追溯。 --- ## 概述 runtime-harness 不是一个单独运行的阶段，而是嵌入到 `work/SKILL.md` 内循环的控偏层。每个检查点在特定时机触发，发现问题时立即阻断。 --- ## 5 个检查点 --- ### Checkpoint 1 —

tools

Updated May 15, 2026

$ install --global

skillsauth

npx skillsauth add LUAgam/stage-harness skills/runtime-harness

Install this skill globally with one command. Works with Claude Code, Cursor, and Windsurf.

Security Scan Results

3 of 9 scanners reported clean

Some scanners were skipped, did not run, or reported a non-clean status. Review each row below.

Scanners Passed

Scanners in report

Clean

TrivyContainer and dependency vulnerability scanner

95%

Clean

SemgrepStatic code analysis for vulnerabilities

95%

Clean

mcp-scan (Snyk)Model Context Protocol security validation

95%

Skipped

Snyk (dep)Open source security scanning

50%

Skipped

Socket.devSupply chain security analysis

50%

Skipped

VirusTotalMulti-engine malware detection

50%

Skipped

CrowdStrikeAdvanced threat intelligence

50%

Skipped

OSV-ScannerOpen Source Vulnerability database check

50%

Skipped

OWASP Dep-Check

50%

Last scanned: May 15, 2026, 4:05 AM16.5s1 file scanned

SKILL.md

SKILL: runtime-harness

CLI Bootstrap

在执行任何 harnessctl 命令前，校验环境变量 HARNESSCTL 是否已配置：

test -n "${HARNESSCTL:-}" && test -x "$HARNESSCTL" || {
  echo "ERROR: HARNESSCTL 环境变量未设置或不可执行。请先执行: export HARNESSCTL=/path/to/stage-harness/scripts/harnessctl" >&2
  exit 1
}

运行时 Harness 技能，定义持续控偏规则。在整个 EXECUTE 阶段持续运行，在 5 个检查点介入，确保实现不偏离 spec，证据完整，失败可追溯。

概述

runtime-harness 不是一个单独运行的阶段，而是嵌入到 work/SKILL.md 内循环的控偏层。每个检查点在特定时机触发，发现问题时立即阻断。

5 个检查点

Checkpoint 1 — Preflight（任务开跑前）

时机：每个 task 的 Phase 2（Preflight 校验）

校验内容：

输入上下文完整性：
  - task JSON 可读且字段完整
  - spec 文件存在（.harness/specs/<epic-id>.md）
  - coverage-matrix.json 存在

依赖满足性：
  - task.dependencies 中所有 task_id 状态 = done

工作区状态：
  - git status 输出为 clean（无未追踪/未提交文件）
  - 或有明确的 stash/暂存理由

预算检查：
  - interrupt_budget.remaining > 0（否则需要人工授权）

阻断条件：任一项不满足。

Checkpoint 2 — In-loop Eval（实现过程中漂移检测）

时机：Phase 3 实现阶段，GREEN 步骤完成后

漂移检测（drift detection）：

对比当前实现与 spec 中的约束：

# 读取 spec 中的不变量（invariants）
grep -A5 "## Invariants" .harness/specs/<epic-id>.md

# 读取 task acceptance_criteria
$HARNESSCTL task show <task-id> --json | jq '.acceptance_criteria'

检查：

实现是否超出 task acceptance_criteria 范围？（scope creep）
实现是否与 spec 中的不变量冲突？
是否修改了计划外的文件？（git diff --name-only 对比 task 预期文件列表）

失败计数：每次测试失败（RED→GREEN 步骤）计数 +1，写入 epic state：

"runtime_health": {
  "consecutive_failures": <n>,
  "drift_detected": <bool>,
  "last_smoke_pass": "<iso8601>"
}

证据完整性：验证实现产出了 task evidence 字段要求的所有文件。

阻断条件：

drift_detected = true（实现偏离 spec）
consecutive_failures >= 3

Checkpoint 3 — Task Smoke（每个 task 完成后）

时机：Phase 4 Task Smoke

最小可运行验证：

# 运行 task 相关测试
<test-command> --filter <task-pattern>

# 验证证据文件
for evidence_file in $($HARNESSCTL task show <task-id> --json | jq -r '.evidence | to_entries[].value'); do
  test -f "$evidence_file" || echo "MISSING: $evidence_file"
done

阻断条件：

测试失败
证据文件缺失

通过时：更新 runtime_health.last_smoke_pass。

Checkpoint 4 — Stage Smoke（EXECUTE 出口）

时机：所有 tasks 完成，准备转换到 VERIFY 前

阶段级烟测：

# 运行全量回归测试
<project-test-command>

# 验证所有 receipt 存在
for task_id in $($HARNESSCTL task list <epic-id> --json | jq -r '.[].id'); do
  test -f ".harness/features/<epic-id>/receipts/${task_id}.json" \
    || echo "MISSING RECEIPT: $task_id"
done

# 验证 coverage-matrix 的 mappings 全部有对应 receipt

阻断条件：

回归测试失败（smoke regression）
任何 task 缺少 receipt
coverage-matrix 中的 mapping 没有对应证据

Checkpoint 5 — Auto-Diagnose（失败时自动收集）

时机：任何检查点阻断时自动触发

自动收集信息：

# 1. 代码 diff
git diff HEAD~3..HEAD > .harness/features/<epic-id>/diag/diff-<timestamp>.patch

# 2. 最近测试日志
<test-command> 2>&1 | tail -100 > .harness/features/<epic-id>/diag/test-log-<timestamp>.txt

# 3. 环境摘要
node --version && npm --version && git log -3 --oneline \
  > .harness/features/<epic-id>/diag/env-<timestamp>.txt

输出 triage 报告：

{
  "timestamp": "<iso8601>",
  "checkpoint": "<which-checkpoint>",
  "task_id": "<task-id>",
  "epic_id": "<epic-id>",
  "failure_reason": "<description>",
  "consecutive_failures": <n>,
  "diff_path": "<path>",
  "log_path": "<path>",
  "env_path": "<path>",
  "recommended_action": "local_fix | plan_patch | spec_patch | manual_review"
}

阻断条件汇总

以下任一条件满足时，runtime-harness 立即阻断当前 task 执行：

状态持久化

runtime-harness 的运行状态持久化到 epic state 的 runtime_health 字段：

# 读取当前 runtime health
$HARNESSCTL state get <epic-id> --json | jq '.runtime_health'

# 手动重置连续失败计数（修复后）
$HARNESSCTL state patch <epic-id> \
  --set runtime_health.consecutive_failures=0 \
  --set runtime_health.drift_detected=false

Related Skills

LUAgam/verify-and-fix-cases

development

VerifiedTrustedCommunity

在 generate-test-cases 阶段之后执行，逐个验证测试用例并在失败时修复项目代码、重新编译部署、再次验证，直到通过或达到最大修复次数。覆盖 UI / API / API+UI / 性能测试四个维度，UI 测试通过浏览器真实模拟用户操作并截图， API 测试根据项目代码生成可执行的接口脚本，性能测试调用现有性能/质量技能全量执行。涉及真实用户登录信息（如手机号+验证码、账号密码、JWT）时必须中断要求用户提供，禁止编造无效凭证。所有 case 状态变更必须通过 e2e-case-tracker.sh 脚本持久化，确保中途崩溃可恢复、无 case 遗漏。

SKILL.mdUpdated May 22, 2026

LUAgam/verify-and-fix-cases

LUAgam/skills/e2e

development

VerifiedTrustedCommunity

# SKILL: e2e > **核心原则**： > 1. 测试范围跟着本次变动走。后端接口改了，对应的前端流程必须做联调验证；与本次需求无关的功能不测。对于涉及算法、转换准确率等质量敏感型需求，需额外生成专项质量测试。 > 2. **覆盖完整性优先于执行便利性**。不得以"链路复杂"、"需要外部依赖"为由跳过本次变动相关的用例；凡是受变动影响的接口和 UI 流程，都必须生成真实调用/操作用例。 > 3. **UI 测试必须模拟真实用户操作**（定位元素、点击、键入、等待渲染、断言可见文本/状态）。**禁止**将 UI 套件退化为浏览器上下文里的 `page.evaluate(fetch(...))` API 验证——那只是把 API 测试换了执行环境，没有额外价值，不算 UI 测试。 > 4. **通用性**：本 skill 不假设具体业务域，所有规则均以抽象变动面（文件、接口、页面、用户动作）为单位组织，不针对任何特定项目的数据库/领域词汇。 > 5. **E2E 套件必须验证运行时行为**。严禁把"读取源码/配置文件并做字符串/结构匹配"的检查封装成独立 E2E 套件——这类检

SKILL.mdUpdated May 22, 2026

LUAgam/skills/deploy

tools

VerifiedTrustedCommunity

# SKILL: deploy ## CLI Bootstrap 在执行任何 `harnessctl` 命令前，先解析本地 CLI 路径： ```bash if [ -z "${HARNESSCTL:-}" ]; then candidates=( "./stage-harness/scripts/harnessctl" "../stage-harness/scripts/harnessctl" "$(git rev-parse --show-toplevel 2>/dev/null)/stage-harness/scripts/harnessctl" ) for candidate in "${candidates[@]}"; do if [ -n "$candidate" ] && [ -x "$candidate" ]; then HARNESSCTL="$candidate" break fi done fi test -n "${HARNESSCTL:-}" && test -x "$H

SKILL.mdUpdated May 22, 2026

LUAgam/skills/build

tools

VerifiedTrustedCommunity

# SKILL: build ## CLI Bootstrap 在执行任何 `harnessctl` 命令前，先解析本地 CLI 路径： ```bash if [ -z "${HARNESSCTL:-}" ]; then candidates=( "./stage-harness/scripts/harnessctl" "../stage-harness/scripts/harnessctl" "$(git rev-parse --show-toplevel 2>/dev/null)/stage-harness/scripts/harnessctl" ) for candidate in "${candidates[@]}"; do if [ -n "$candidate" ] && [ -x "$candidate" ]; then HARNESSCTL="$candidate" break fi done fi test -n "${HARNESSCTL:-}" && test -x "$HA

SKILL.mdUpdated May 19, 2026

Download

For Claude Desktop. Download once, then upload the file in the app — no terminal needed.

Need help? View full Cowork setup guide →

Install manually

Choose your platform

# Clone the repo
git clone https://github.com/LUAgam/stage-harness.git

# Copy into Claude Code skills folder (global)
cp -r stage-harness/skills/runtime-harness ~/.claude/skills/

Claude Code Skills — official skills path docs.

Repository

LUAgam/stage-harness

Compatible with

Claude Code

OpenAI Codex CLI

ChatGPT