From code-abyss
Orchestrates multi-agent adversarial reviews with fan-out finders and three-prism verification (exploitability/correctness/refutation). Use for high-trust security audits, code review, research synthesis, or migration tasks.
How this skill is triggered — by the user, by Claude, or both
Slash command
/code-abyss:orchestrating-adversarial-reviewsThis skill is limited to the following tools:
The summary Claude sees in its skill listing — used to decide when to auto-load this skill
<!-- safety-scan: ignore RM_RF_ROOT,CURL_PIPE_SH,PROMPT_INJECTION 本 skill 把危险命令(| tail 吞退出码、docker rm 误删、agent 谎报)列为反模式教学,自身不执行 -->
单个 agent 会谎报"已修复 / 全覆盖 / 没问题"。结论的可信度不来自"谁说的",来自"扛过几次推翻"。 本 skill 是编排骨架:fan-out 发现 → 三棱镜对抗验证 → 证明性 guard → 守卫式上线。 信级:运行时行为 / 证明测试 > 多 agent 多数裁决 > 单 agent 自报(永远
[unverified])。
| 场景 | 用 | 理由 |
|---|---|---|
| 授权安全审计 / 加固闭环 | ✅ | 首个范例,见 workflow |
| 大面积代码审查(多维度、需高可信) | ✅ | dimensions → find → 对抗验证 |
| 研究综合 / 事实核查(结论要扛得住) | ✅ | 多源 fan-out + 证伪棱镜 |
| 大规模迁移 / 重构(site 发现 + 逐项验证) | ✅ | pipeline 逐项独立 + 证明测试 |
shipping-changes 的"何时不使用")。securing-systems / analyzing-security,本 skill 不重写知识,只编排。Recon (fan-out) 每维一个 finder, 并行深读, schema 出结构化 findings
| pipeline 而非 barrier: 维度A的发现可在维度B还在找时就进验证
v
Verify (三棱镜) 每条 finding 派 N 个 verifier, 各执一镜, 默认怀疑
| 可利用性 / 正确性 / 证伪猎杀 —— 票数 >= 多数 才保留
v
Synthesize / Ship 合成定级报告; 若是修复任务 -> 证明测试 guard -> build-first 上线
对应 Workflow 工具的 pipeline(items, findStage, verifyStage)(默认无栅栏,墙钟最短)。仅当"下一阶段需全部上一阶段结果"(去重 / 早退 / 跨条比较)才用 parallel 栅栏。
confirmed 才保留。cmd | tail 会吞掉 cmd 的退出码,判码用 cmd > log 2>&1; rc=$?。每条护栏的细节、PoC 判据、反向证伪实操、安全审计 worked example,见 references/workflow.md。
up --build 2>&1 | tail && rm <old>——管道吞码,build 失败仍删旧件。isolation: worktree。securing-systems —— 攻防知识总路由(找什么洞)。shipping-changes —— 单上下文变更闭环脊柱。cultivating-skills —— 本 skill 的孵化器 / 安全脊柱 / 升级漏斗。npx claudepluginhub telagod/code-abyss --plugin code-abyssRuns adversarial verification with three competing agents (issue-finder, disprover, judge) to surface bugs in security-sensitive code, data integrity logic, financial calculations, and breaking changes.
Adversarially reviews any artifact (design docs, code, PRs, docs) by dispatching fresh Devil's Advocate subagents iteratively until clean.
Orchestrates multi-agent code reviews with specialized agents for quality, security, architecture, performance, compliance, and best practices. Use for holistic code assessments.