问题排查与修复

概述

随机猜测式修 bug 浪费时间，还会引入新问题。快速补丁掩盖根因，迟早复发。

核心原则：先找到根因，再动手修复。治症不治本就是失败。

本 skill 在经典调试流程基础上，新增修复规模评估环节——当修复工作量较大时，联动 implementation-planning skill 创建结构化修复计划，避免盲目修改导致混乱。

版本号约定

1.X 为占位符，详见 requirements-workshop/SKILL.md。真实路径必须替换为具体数字（如 workplace/1/tech-design/）。

铁律

没有根因调查，就不允许提修复方案

未完成 Phase 1 之前，不能提出任何修复建议。

适用场景

适用于任何技术问题：测试失败、生产 bug、异常行为、性能问题、构建失败、集成问题。

以下场景尤其需要严格遵循流程：问题看似简单、有时间压力、已多次修复未果、上次修复未生效、未完全理解问题时。

五阶段流程

每个阶段必须完成后才能进入下一阶段。

Phase 1：根因调查

在提出任何修复之前：

仔细阅读错误信息
- 不要跳过任何错误或警告
- 错误信息往往包含精确线索
- 完整阅读堆栈跟踪
- 记录行号、文件路径、错误码
稳定复现
- 能可靠触发吗？
- 精确的复现步骤是什么？
- 每次都出现吗？
- 无法复现 → 收集更多数据，不要猜
检查近期变更
- 什么变更可能导致了这个问题？
- Git diff、近期提交
- 新依赖、配置变更
- 环境差异

多组件系统收集证据

当系统有多个组件（CI → 构建 → 签名，API → 服务 → 数据库）：

在提出修复之前，添加诊断埋点：

对每个组件边界：
  - 记录进入组件的数据
  - 记录离开组件的数据
  - 验证环境/配置传播
  - 检查每层状态

运行一次收集证据，定位故障出现在哪一层
再针对该组件深入调查

追踪数据流

当错误在调用栈深处：

参见 references/root-cause-tracing.md 的完整回溯追踪技术。

简版：
- 错误值从哪来？
- 谁传入了错误值？
- 持续向上追溯直到源头
- 在源头修复，不在表象处修复
不确定是哪个测试造成污染时： 使用 scripts/find-polluter.sh 二分定位：
```
./scripts/find-polluter.sh '.git' 'src/**/*.test.ts'
```

⚠️ 特殊情形：测试通过但主流程不对

如果你发现"测试全部通过，但手动跑主流程明显不正常"，这是降级逻辑的典型信号，在继续 Phase 2 之前先做降级排查：

搜索代码中的降级信号：
  - catch 后返回假成功（try { ... } catch { return { success: true } }）
  - 功能缩水：声称实现A，实际执行B（如"上传文件"只存了文件名）
  - 条件跳过：if (error || !config) return defaultValue
  - Mock泄漏：硬编码返回值残留在生产路径
  - 静默忽略：日志打印错误但继续往下走

找到降级逻辑后，先移除它，再重新从 Phase 1 步骤 1 开始——因为降级逻辑一旦移除，真实错误才会暴露出来，之前的错误信息和复现步骤很可能会变化。

Phase 2：模式分析

修复前先找模式：

找正常工作的参照
- 在同一代码库找到类似的正常工作代码
- 什么能正常工作？跟出问题的有什么相似？
对比参考实现
- 如果是在实现某个模式，完整阅读参考实现
- 不要略读——逐行阅读
- 完全理解模式后再应用
识别差异
- 正常代码和异常代码之间有什么不同？
- 列出每个差异，不管多小
- 不要假定"这不重要"
理解依赖
- 需要哪些其他组件？
- 需要什么设置、配置、环境？
- 有哪些隐含假设？

Phase 3：假设验证

科学方法：

提出单一假设
- 明确陈述："我认为 X 是根因，因为 Y"
- 写下来
- 要具体，不要含糊
最小化测试
- 做最小改动来验证假设
- 一次只改一个变量
- 不要同时修多个东西
验证后再继续
- 验证通过？→ 进入 Phase 4 规模评估
- 没通过？→ 提出新假设
- 不要在失败的假设上叠加新修改
不懂就说不懂
- 说"我不理解 X"
- 不要装懂
- 寻求帮助
- 继续研究
根因未确认前，禁止提出修复方案
- 如果你还在"怀疑可能是X"阶段，不允许说"我来修一下X试试"
- 必须完成假设验证（步骤3通过）才能进入 Phase 4
- 提前提修复方案 = 在没理解问题时动手 = 必然掩盖根因或引入新问题

Phase 4：修复规模评估

在进入实施之前，评估修复的规模和复杂度。这是本 skill 区别于普通调试流程的关键步骤。

规模评估标准

对已确认的根因，评估以下维度：

| 维度 | 小修 | 大修 | |------|------|------| | 涉及文件数 | ≤ 3 个文件 | > 3 个文件 | | 涉及模块 | 单一模块 | 跨模块/跨层 | | 预估工时 | < 4 小时 | ≥ 4 小时 | | 变更性质 | 逻辑修正/参数调整 | 架构调整/接口变更/新增组件 | | 测试影响 | 修改少量测试 | 需要新增测试套件/重构测试结构 | | 前后端 | 仅一端 | 前后端都需改动 |

决策规则

小修（满足以下全部条件）→ 直接进入 Phase 5：

修改 ≤ 3 个文件
不跨模块
预估 < 4 小时
不涉及接口变更

大修（满足以下任一条件）→ 联动 implementation-planning：

修改 > 3 个文件
跨模块或跨层
预估 ≥ 4 小时
涉及接口变更、架构调整
前后端都需改动
Phase 3 中已失败 3+ 次假设（说明问题可能在架构层面）

联动 implementation-planning 的流程

当判断为大修时：

整理修复方案概要
- 根因说明（来自 Phase 1-3 的结论）
- 修复范围（涉及的模块/层/文件）
- 修复策略（来自 Phase 2 的模式分析）
- 修复约束（不能破坏的现有行为、兼容性要求）
检查技术方案是否已存在（只读引用）
- 如果 workplace/1.X/tech-design/ 下有相关技术方案 → 引用其架构、数据模型、API 设计等章节作为修复依据
- 如果没有 → 不创建技术方案文档（tech-design HARD-GATE 要求必须有需求文档），将修复方案概要直接作为 implementation-planning 的输入
调用 implementation-planning skill
- 将修复方案概要作为输入
- 生成的计划中每个模块标注 [BUGFIX] 前缀，区分于正常需求开发
- 计划中增加"回归验证"模块作为最后一个模块
- 计划确认后，调用 plan-execution skill 执行

修复计划模板补充

联动生成的计划中，每个模块详情需额外包含：

**关联根因**：[本模块修复的根因部分]
**风险点**：[本模块修改可能影响的现有行为]
**回退方案**：[如果修复引入新问题如何回退]

计划末尾增加回归验证模块：

### M{N}: 回归验证

**目标**：确认修复未引入新问题
**层**：跨层
**前置依赖**：所有修复模块

**子步骤**：
1. 运行全量测试套件
2. 验证原 bug 场景已修复
3. 检查关联功能的回归

**验收标准**：
- 全量测试 PASS
- 原 bug 复现步骤不再触发
- 关联功能无回归

向用户说明
- 告知用户为什么判定为大修
- 展示修复方案概要
- 提交计划供用户确认后再执行

Phase 5：修复实施

根据 Phase 4 的决策，走两条路线：

路线 A：小修直接实施

创建失败测试用例
- 最简复现
- 尽量自动化测试
- 无框架时用一次性脚本
- 修复前必须有测试
实施单一修复
- 针对已确认的根因
- 一次改一处
- 不做"顺手优化"
- 不捆绑重构
涉及超时/等待场景时，参见 references/condition-based-waiting.md 用条件轮询替代任意超时。
验证修复
- 测试通过了？
- 没有破坏其他测试？
- 问题确实解决了？
修复验证通过后，参见 references/defense-in-depth.md 考虑在多个层添加防御，防止同类问题复现。
修复未生效
- 停下来
- 计数：已经试了几次修复？
- < 3 次 → 回到 Phase 1，用新信息重新分析
- ≥ 3 次 → 进入架构质疑（步骤 5）
- 不要在 3 次失败后继续试第 4 次
3+ 次修复失败：质疑架构

架构问题的信号：
- 每次修复都在不同位置暴露新的共享状态/耦合
- 修复需要"大规模重构"才能实施
- 每次修好在 A 处，B 处又出问题
停下来质疑根本问题：
- 这个模式本身是否合理？
- 是不是在靠惯性坚持？
- 应该重构架构还是继续修补？
在尝试更多修复前，与用户讨论。

这不是假设失败——这是架构选错了。

→ 此时应联动 implementation-planning，将架构重构作为正式计划推进。

路线 B：大修按计划执行

修复计划由 implementation-planning 生成后，调用 plan-execution skill 按模块顺序逐个实施，最后一个模块为回归验证。

产出排查报告

修复完成后（无论 Route A 还是 Route B），将排查过程与结论记录到 workplace/1.X/troubleshooting/：

命名：YYYY-MM-DD-{问题关键词}-排查报告.md

# {问题关键词} 排查报告

## 问题描述
- 现象：[错误信息/异常行为]
- 复现步骤：[步骤]
- 影响范围：[受影响功能/用户]

## 根因分析
- 根因：[一句话]
- 证据链：[Phase 1-3 收集的关键证据]
- 排除的假设：[已验证不成立的其他假设]

## 修复内容
- 修复方式：[一句话]
- 修改文件：[列表]
- 新增测试：[测试文件路径 + 覆盖场景]

## 验证结果
- 测试执行：[命令 + 输出]
- 回归检查：[确认无破坏其他功能]

## 经验教训（可选）
- [根因类型、预防措施、对架构的启示]

填写说明：

Route A：完整填写所有章节
Route B：修复内容写"参见修复计划 {plan文件路径}"，验证结果在 plan-execution 完成后补充

自检：

问题描述是否包含可复现步骤？
根因是否追溯到源头（不是中间表象）？
修复是否针对根因（不是"试试看"）？
测试是否覆盖根因场景？

红灯信号——停下来遵循流程

当你发现自己在想以下任何一条，立即回到 Phase 1：

| 红灯思维 | 为什么必须停下 | |----------|---------------| | "先快速修一下，回头再查" | 第一次修复定基调，从头就做对 | | "改一下 X 试试看" | 没根因就动手 = 瞎猜 | | "把几个改动一起提交" | 无法隔离哪个有效，还会引入新 bug | | "跳过测试，我手动验证" | 没测试的修复靠不住，测试先证明问题存在 | | "大概是 X 的问题，我先改了" | 看到症状 ≠ 理解根因 | | "不完全理解但这样可能行" | 一知半解必定出 bug | | "参考文档太长，我按自己的方式来" | 完整阅读参考实现 | | "问题很简单，不需要流程" | 简单问题也有根因，流程对简单 bug 更快 | | "紧急，没时间走流程" | 系统排查比瞎猜快 | | "再试一次修复"（已失败 2+ 次） | 3+ 次失败 = 架构问题，质疑模式不要继续试（见 Phase 5 路线 A 步骤 5） | | 每次修复都在不同位置暴露新问题 | 架构选错了，联动 implementation-planning 推进重构 | | "大修就直接动手改吧" | 大修没有计划必乱，用 implementation-planning 管住范围 | | "测试全通过但功能不对，先继续修" | 测试通过≠功能正确，先排查是否有降级逻辑让错误变隐形（见 Phase 1 步骤 4） | | "加个catch处理一下这个错误" | catch掩盖错误就是降级逻辑，必须先搞清楚为什么会有这个错误 | | "这里加个fallback值保证不崩" | fallback是在掩盖根因，问题还在，只是看不见了 |

来自用户的纠偏信号

注意这些提示：

"是这样吗？" → 你假设了但没验证
"能不能看到……？" → 应该先加证据收集
"别猜了" → 你在没有理解的情况下提出修复
"好好想想" → 质疑根本问题，不是表象
"是不是卡住了？" → 你的方法不奏效

看到这些信号时：停下来，回到 Phase 1。

快速参考

| 阶段 | 关键活动 | 成功标准 | |------|----------|----------| | 1. 根因调查 | 读错误、复现、查变更、收证据 | 理解"是什么"和"为什么" | | 2. 模式分析 | 找参照、对比差异 | 识别关键差异 | | 3. 假设验证 | 提出假设、最小测试 | 假设确认或提出新假设 | | 4. 规模评估 | 评估修复范围和复杂度 | 判定小修直接修 / 大修走计划 | | 5. 修复实施 | 小修：测试→修复→验证→产出报告 / 大修：按计划执行→产出报告 | bug 解决，排查报告已归档 |

当流程揭示"找不到根因"

如果系统调查后发现问题是环境、时序或外部因素导致的：

你已经完成了流程
记录调查了什么
实现适当的处理（重试、超时、错误提示）
添加监控/日志供未来调查

但注意： 95% 的"找不到根因"其实是调查不够深入。

辅助技术

以下技术是本 skill 的一部分，参考文档位于 references/，配套脚本位于 scripts/：

references/root-cause-tracing.md - 沿调用栈回溯追踪 bug 到原始触发点（配套脚本 scripts/find-polluter.sh）
references/defense-in-depth.md - 找到根因后在多个层添加验证
references/condition-based-waiting.md - 用条件轮询替代任意超时（配套实现见 scripts/condition-based-waiting-example.ts）

关联 skill

| Skill | 关系 | |-------|------| | implementation-planning | 修复规模大时（>3 文件/跨模块/≥4h），创建结构化修复计划 | | tech-design | 大修时只读引用已有技术方案（架构/数据模型/API 等章节），不得创建新的技术方案文档 | | plan-execution | 大修修复计划创建后，按模块顺序执行开发与验证 |

问题排查与修复

概述

随机猜测式修 bug 浪费时间，还会引入新问题。快速补丁掩盖根因，迟早复发。

核心原则：先找到根因，再动手修复。治症不治本就是失败。

版本号约定

1.X 为占位符，详见 requirements-workshop/SKILL.md。真实路径必须替换为具体数字（如 workplace/1/tech-design/）。

铁律

没有根因调查，就不允许提修复方案

未完成 Phase 1 之前，不能提出任何修复建议。

适用场景

适用于任何技术问题：测试失败、生产 bug、异常行为、性能问题、构建失败、集成问题。

以下场景尤其需要严格遵循流程：问题看似简单、有时间压力、已多次修复未果、上次修复未生效、未完全理解问题时。

五阶段流程

每个阶段必须完成后才能进入下一阶段。

Phase 1：根因调查

在提出任何修复之前：

仔细阅读错误信息
- 不要跳过任何错误或警告
- 错误信息往往包含精确线索
- 完整阅读堆栈跟踪
- 记录行号、文件路径、错误码
稳定复现
- 能可靠触发吗？
- 精确的复现步骤是什么？
- 每次都出现吗？
- 无法复现 → 收集更多数据，不要猜
检查近期变更
- 什么变更可能导致了这个问题？
- Git diff、近期提交
- 新依赖、配置变更
- 环境差异

多组件系统收集证据

当系统有多个组件（CI → 构建 → 签名，API → 服务 → 数据库）：

在提出修复之前，添加诊断埋点：

对每个组件边界：
  - 记录进入组件的数据
  - 记录离开组件的数据
  - 验证环境/配置传播
  - 检查每层状态

运行一次收集证据，定位故障出现在哪一层
再针对该组件深入调查

追踪数据流

当错误在调用栈深处：

参见 references/root-cause-tracing.md 的完整回溯追踪技术。

简版：
- 错误值从哪来？
- 谁传入了错误值？
- 持续向上追溯直到源头
- 在源头修复，不在表象处修复
不确定是哪个测试造成污染时： 使用 scripts/find-polluter.sh 二分定位：
```
./scripts/find-polluter.sh '.git' 'src/**/*.test.ts'
```

⚠️ 特殊情形：测试通过但主流程不对

如果你发现"测试全部通过，但手动跑主流程明显不正常"，这是降级逻辑的典型信号，在继续 Phase 2 之前先做降级排查：

搜索代码中的降级信号：
  - catch 后返回假成功（try { ... } catch { return { success: true } }）
  - 功能缩水：声称实现A，实际执行B（如"上传文件"只存了文件名）
  - 条件跳过：if (error || !config) return defaultValue
  - Mock泄漏：硬编码返回值残留在生产路径
  - 静默忽略：日志打印错误但继续往下走

Phase 2：模式分析

修复前先找模式：

找正常工作的参照
- 在同一代码库找到类似的正常工作代码
- 什么能正常工作？跟出问题的有什么相似？
对比参考实现
- 如果是在实现某个模式，完整阅读参考实现
- 不要略读——逐行阅读
- 完全理解模式后再应用
识别差异
- 正常代码和异常代码之间有什么不同？
- 列出每个差异，不管多小
- 不要假定"这不重要"
理解依赖
- 需要哪些其他组件？
- 需要什么设置、配置、环境？
- 有哪些隐含假设？

Phase 3：假设验证

科学方法：

提出单一假设
- 明确陈述："我认为 X 是根因，因为 Y"
- 写下来
- 要具体，不要含糊
最小化测试
- 做最小改动来验证假设
- 一次只改一个变量
- 不要同时修多个东西
验证后再继续
- 验证通过？→ 进入 Phase 4 规模评估
- 没通过？→ 提出新假设
- 不要在失败的假设上叠加新修改
不懂就说不懂
- 说"我不理解 X"
- 不要装懂
- 寻求帮助
- 继续研究
根因未确认前，禁止提出修复方案
- 如果你还在"怀疑可能是X"阶段，不允许说"我来修一下X试试"
- 必须完成假设验证（步骤3通过）才能进入 Phase 4
- 提前提修复方案 = 在没理解问题时动手 = 必然掩盖根因或引入新问题

Phase 4：修复规模评估

在进入实施之前，评估修复的规模和复杂度。这是本 skill 区别于普通调试流程的关键步骤。

规模评估标准

对已确认的根因，评估以下维度：

决策规则

小修（满足以下全部条件）→ 直接进入 Phase 5：

修改 ≤ 3 个文件
不跨模块
预估 < 4 小时
不涉及接口变更

大修（满足以下任一条件）→ 联动 implementation-planning：

修改 > 3 个文件
跨模块或跨层
预估 ≥ 4 小时
涉及接口变更、架构调整
前后端都需改动
Phase 3 中已失败 3+ 次假设（说明问题可能在架构层面）

联动 implementation-planning 的流程

当判断为大修时：

整理修复方案概要
- 根因说明（来自 Phase 1-3 的结论）
- 修复范围（涉及的模块/层/文件）
- 修复策略（来自 Phase 2 的模式分析）
- 修复约束（不能破坏的现有行为、兼容性要求）
检查技术方案是否已存在（只读引用）
- 如果 workplace/1.X/tech-design/ 下有相关技术方案 → 引用其架构、数据模型、API 设计等章节作为修复依据
- 如果没有 → 不创建技术方案文档（tech-design HARD-GATE 要求必须有需求文档），将修复方案概要直接作为 implementation-planning 的输入
调用 implementation-planning skill
- 将修复方案概要作为输入
- 生成的计划中每个模块标注 [BUGFIX] 前缀，区分于正常需求开发
- 计划中增加"回归验证"模块作为最后一个模块
- 计划确认后，调用 plan-execution skill 执行

修复计划模板补充

联动生成的计划中，每个模块详情需额外包含：

**关联根因**：[本模块修复的根因部分]
**风险点**：[本模块修改可能影响的现有行为]
**回退方案**：[如果修复引入新问题如何回退]

计划末尾增加回归验证模块：

### M{N}: 回归验证

**目标**：确认修复未引入新问题
**层**：跨层
**前置依赖**：所有修复模块

**子步骤**：
1. 运行全量测试套件
2. 验证原 bug 场景已修复
3. 检查关联功能的回归

**验收标准**：
- 全量测试 PASS
- 原 bug 复现步骤不再触发
- 关联功能无回归

向用户说明
- 告知用户为什么判定为大修
- 展示修复方案概要
- 提交计划供用户确认后再执行

Phase 5：修复实施

根据 Phase 4 的决策，走两条路线：

路线 A：小修直接实施

创建失败测试用例
- 最简复现
- 尽量自动化测试
- 无框架时用一次性脚本
- 修复前必须有测试
实施单一修复
- 针对已确认的根因
- 一次改一处
- 不做"顺手优化"
- 不捆绑重构
涉及超时/等待场景时，参见 references/condition-based-waiting.md 用条件轮询替代任意超时。
验证修复
- 测试通过了？
- 没有破坏其他测试？
- 问题确实解决了？
修复验证通过后，参见 references/defense-in-depth.md 考虑在多个层添加防御，防止同类问题复现。
修复未生效
- 停下来
- 计数：已经试了几次修复？
- < 3 次 → 回到 Phase 1，用新信息重新分析
- ≥ 3 次 → 进入架构质疑（步骤 5）
- 不要在 3 次失败后继续试第 4 次
3+ 次修复失败：质疑架构

架构问题的信号：
- 每次修复都在不同位置暴露新的共享状态/耦合
- 修复需要"大规模重构"才能实施
- 每次修好在 A 处，B 处又出问题
停下来质疑根本问题：
- 这个模式本身是否合理？
- 是不是在靠惯性坚持？
- 应该重构架构还是继续修补？
在尝试更多修复前，与用户讨论。

这不是假设失败——这是架构选错了。

→ 此时应联动 implementation-planning，将架构重构作为正式计划推进。

路线 B：大修按计划执行

修复计划由 implementation-planning 生成后，调用 plan-execution skill 按模块顺序逐个实施，最后一个模块为回归验证。

产出排查报告

修复完成后（无论 Route A 还是 Route B），将排查过程与结论记录到 workplace/1.X/troubleshooting/：

命名：YYYY-MM-DD-{问题关键词}-排查报告.md

# {问题关键词} 排查报告

## 问题描述
- 现象：[错误信息/异常行为]
- 复现步骤：[步骤]
- 影响范围：[受影响功能/用户]

## 根因分析
- 根因：[一句话]
- 证据链：[Phase 1-3 收集的关键证据]
- 排除的假设：[已验证不成立的其他假设]

## 修复内容
- 修复方式：[一句话]
- 修改文件：[列表]
- 新增测试：[测试文件路径 + 覆盖场景]

## 验证结果
- 测试执行：[命令 + 输出]
- 回归检查：[确认无破坏其他功能]

## 经验教训（可选）
- [根因类型、预防措施、对架构的启示]

填写说明：

Route A：完整填写所有章节
Route B：修复内容写"参见修复计划 {plan文件路径}"，验证结果在 plan-execution 完成后补充

自检：

问题描述是否包含可复现步骤？
根因是否追溯到源头（不是中间表象）？
修复是否针对根因（不是"试试看"）？
测试是否覆盖根因场景？

红灯信号——停下来遵循流程

当你发现自己在想以下任何一条，立即回到 Phase 1：

来自用户的纠偏信号

注意这些提示：

"是这样吗？" → 你假设了但没验证
"能不能看到……？" → 应该先加证据收集
"别猜了" → 你在没有理解的情况下提出修复
"好好想想" → 质疑根本问题，不是表象
"是不是卡住了？" → 你的方法不奏效

看到这些信号时：停下来，回到 Phase 1。

快速参考

当流程揭示"找不到根因"

如果系统调查后发现问题是环境、时序或外部因素导致的：

你已经完成了流程
记录调查了什么
实现适当的处理（重试、超时、错误提示）
添加监控/日志供未来调查

但注意： 95% 的"找不到根因"其实是调查不够深入。

辅助技术

以下技术是本 skill 的一部分，参考文档位于 references/，配套脚本位于 scripts/：

references/root-cause-tracing.md - 沿调用栈回溯追踪 bug 到原始触发点（配套脚本 scripts/find-polluter.sh）
references/defense-in-depth.md - 找到根因后在多个层添加验证
references/condition-based-waiting.md - 用条件轮询替代任意超时（配套实现见 scripts/condition-based-waiting-example.ts）

Adoption

anian0/issue-troubleshooting

$ install --global

Security Scan Results

SKILL.md

问题排查与修复

概述

版本号约定

铁律

适用场景

五阶段流程

Phase 1：根因调查

Phase 2：模式分析

Phase 3：假设验证

Phase 4：修复规模评估

规模评估标准

决策规则

联动 implementation-planning 的流程

Phase 5：修复实施

路线 A：小修直接实施

路线 B：大修按计划执行

产出排查报告

红灯信号——停下来遵循流程

来自用户的纠偏信号

快速参考

当流程揭示"找不到根因"

辅助技术

关联 skill

Related Skills

anian0/tech-design-v2

anian0/requirements-workshop-v2

anian0/project-development-v2-common

anian0/project-development-review-v2

anian0/issue-troubleshooting

$ install --global

Security Scan Results

SKILL.md

问题排查与修复

概述

版本号约定

铁律

适用场景

五阶段流程

Phase 1：根因调查

Phase 2：模式分析

Phase 3：假设验证

Phase 4：修复规模评估

规模评估标准

决策规则

联动 implementation-planning 的流程

Phase 5：修复实施

路线 A：小修直接实施

路线 B：大修按计划执行

产出排查报告

红灯信号——停下来遵循流程

来自用户的纠偏信号

快速参考

当流程揭示"找不到根因"

辅助技术

关联 skill

Related Skills

anian0/tech-design-v2

anian0/requirements-workshop-v2

anian0/project-development-v2-common

anian0/project-development-review-v2