From mattpocock-skills
Guides a disciplined debugging loop: reproduce, hypothesise, instrument, fix, and regression-test. Use for diagnosing bugs, crashes, or performance regressions.
How this skill is triggered — by the user, by Claude, or both
Slash command
/mattpocock-skills:diagnoseThe summary Claude sees in its skill listing — used to decide when to auto-load this skill
处理困难 bug 的纪律。只有在理由明确时才跳过阶段。
处理困难 bug 的纪律。只有在理由明确时才跳过阶段。
这就是这个 skill 的核心。 其他部分都是机械流程。如果你有一个快速、确定、agent 可运行的 pass/fail 信号来覆盖这个 bug,你就能找到原因;bisection、hypothesis-testing 和 instrumentation 都只是消费这个信号。没有它,盯着代码看再久也救不了你。
在这里投入不成比例的精力。要主动。要有创造性。不要轻易放弃。
git bisect run。scripts/hitl-loop.template.sh 驱动_人_,让循环仍然结构化。捕获的输出再反馈给你。构建正确的反馈环,bug 就已经修好 90%。
把反馈环当作一个产品。有了_某个_循环之后,问:
30 秒且 flaky 的循环只比没有循环好一点点。2 秒且确定的循环是调试超能力。
目标不是干净复现,而是提高复现率。把触发器循环 100 次,并行化、加压、缩窄 timing windows、注入 sleeps。50% flake 的 bug 可以调试;1% 不行。持续提高复现率,直到它可调试。
停下来并明确说明。列出你尝试过的方式。向用户请求:(a) 可复现环境的访问权限,(b) 捕获的 artifact(HAR file、log dump、core dump、带时间戳的 screen recording),或 (c) 添加临时 production instrumentation 的许可。不要在没有循环时继续 hypothesise。
在你有一个可信的循环之前,不要进入 Phase 2。
运行循环。看到 bug 出现。
确认:
复现 bug 之前不要继续。
在测试任何假设前,先生成 3-5 个排序后的 hypotheses。只生成一个假设会把你锚定在第一个看起来合理的想法上。
每个 hypothesis 必须是可证伪的:说明它产生的预测。
格式:"If is the cause, then will make the bug disappear / will make it worse."
如果你说不出预测,这个 hypothesis 就是 vibe。丢掉或收紧。
在测试前把排序列表展示给用户。 他们通常有 domain knowledge,可以瞬间重排(“我们刚部署了 #3 的改动”),或知道哪些假设已经被排除。这个 checkpoint 便宜但省时。不要阻塞在这里;如果用户 AFK,就按你的排序继续。
每个 probe 都必须映射到 Phase 3 中的一个具体预测。一次只改一个变量。
工具偏好:
给每条 debug log 加唯一前缀,例如 [DEBUG-a4f2]。最后清理就变成一次 grep。无标签 log 会留下;有标签 log 会消失。
Perf branch. 对性能回退,logs 通常不合适。先建立 baseline measurement(timing harness、performance.now()、profiler、query plan),然后 bisect。先测量,再修复。
在 fix 之前写 regression test,但前提是存在正确的 seam。
正确 seam 是指 test 能在 call site 复现真实 bug pattern。如果唯一可用的 seam 太浅(bug 需要多个 caller 但测试只有单一 caller;unit test 无法复制触发 bug 的链路),那里的 regression test 会带来虚假信心。
如果没有正确 seam,这本身就是发现。 记录它。codebase architecture 正在阻止这个 bug 被锁住。把它标记到下一阶段。
如果存在正确 seam:
宣布完成前必须做:
[DEBUG-...] instrumentation 已删除(grep 前缀)然后问:什么本可以防止这个 bug? 如果答案涉及 architecture change(没有好的 test seam、callers 缠绕、隐藏 coupling),带着具体信息交给 /improve-codebase-architecture skill。建议应在 fix 落地后提出,而不是之前;现在你掌握的信息比开始时更多。
npx claudepluginhub vinvcn/mattpocock-skills-zh-cnProvides a disciplined diagnosis loop for hard bugs and performance regressions: reproduce, minimise, hypothesise, instrument, fix, regression-test.
Implements disciplined diagnosis loop for hard bugs and performance regressions: reproduce → minimise → hypothesise → instrument → fix → regression-test. Use for bug reports, failures, or 'diagnose this'.
Structured diagnosis protocol for hard bugs and performance regressions: build a deterministic feedback loop, then bisect/hypothesise/fix. Activate when debugging, triaging failures, or investigating regressions.