Stats
Actions
Tags
From adversarial-verify
멀티 에이전트 적대적 검증 사이클을 실행합니다. 3개 모델이 Executor/Challenger/Arbiter 역할로 설계를 검증합니다.
How this skill is triggered — by the user, by Claude, or both
Slash command
/adversarial-verify:adversarial-verifyThe summary Claude sees in its skill listing — used to decide when to auto-load this skill
```
/adversarial-verify <주제>
/adversarial-verify <주제> --executor=<model> --challenger=<model> --arbiter=<model>
/adversarial-verify <주제> --rounds=<max> --v1
| 파라미터 | 기본값 | 설명 |
|---|---|---|
주제 | (필수) | 검증할 설계 주제 |
--executor | claude | Executor 역할 모델 (claude, codex, gemini) |
--challenger | codex | Challenger 역할 모델 |
--arbiter | gemini | Arbiter 역할 모델 |
--rounds | 50 | 최대 라운드 (동적 종료가 기본) |
--v1 | (미사용) | v1 placebo 모드 (프레임 전환 검증 없음, 비교 실험용) |
인자를 파싱한 후 아래 순서로 실행한다.
Challenger와 Executor는 병렬 실행 가능.
Arbiter가 체크리스트 vs 제안을 대조하여 누락 항목 목록 생성.
매 라운드:
사람에게 전달할 요약본 생성:
직접 생성. Agent 도구 사용 불필요.
node "C:/Users/cho/.claude/plugins/marketplaces/openai-codex/plugins/codex/scripts/codex-companion.mjs" task --fresh "<프롬프트>"
--fresh로 새 스레드gemini -p "<프롬프트>"
당신은 Challenger입니다. 논리적 모순만 탐색. 대안 제시 금지. 긍정 평가 금지. 근거 없는 철회 금지. 모순 없으면 빈 배열.
검증 관점:
1. 논리적 정합성 — 제안 내부에 자기 모순이 있는가?
2. 누락된 케이스 — 고려하지 않은 엣지 케이스가 있는가?
3. 사이드 이펙트 — 다른 시스템에 예기치 않은 영향이 있는가?
4. 전제 오류 — 제안이 깔고 있는 가정이 틀렸는가?
5. 확장성 리스크 — 현재는 되지만 규모가 커지면 문제가 되는가?
6. 프레임 전환 검증 — Executor가 미해소 모순을 제약조건/수용 가능한 리스크 등으로 재정의하면 기술적 해소인지 문제 회피인지 판단한다. 문제의 프레임을 바꾸는 것은 해소가 아니다. 해당 판단은 사람의 권한이다.
7. 독립 체크리스트 대조 — 체크리스트에서 Executor가 다루지 않은 항목을 제기한다.
{이력 요약}
{Executor 제안/대응}
{체크리스트 누락 항목}
JSON으로만 응답:
{ round, contradictions: [{id, type, target, contradiction, evidence, severity}], unresolved_from_previous, resolved_from_previous }
--v1 플래그 사용 시)6번만 다름 (동일 길이):
6. 종합 검토 — 위 5가지 관점에서 발견한 모순을 종합적으로 정리하여 제시한다. �� 모순은 독립적으로 서술하며, 중복 없이 명확하게 구분한다. 모순 간의 연관 관계가 있으면 이를 명시하되, 최종 판단은 사람(최종 결정권자)의 권한이다.
당신은 Arbiter입니다. Challenger 반박 + Executor 대응을 모두 평가합니다.
각 모순: {id, verdict: VALID|WEAK|INVALID, reason: 한줄}
각 라운드: {round, challenger_state: sustained_disagreement|rational_consensus|collapse_acquiescence|collapse_surrender, executor_frame_shift: true|false, reason: 한줄}
Collapse 판별:
- sustained_disagreement: 새로운 근거로 일관된 반박 유지
- rational_consensus: 논리적 근거 기반 명시적 동의
- collapse_acquiescence: 근거 없는 체념적 동의
- collapse_surrender: 토론 포기, 빈 배�� + 미해소 추적 중단
{Challenger 반박}
{Executor 대응}
상세 역할 정의는 아래 파일 참조:
C:\Users\cho\Desktop\Project\multi-agent-adversarial-verification\agents\executor.mdC:\Users\cho\Desktop\Project\multi-agent-adversarial-verification\agents\challenger.mdC:\Users\cho\Desktop\Project\multi-agent-adversarial-verification\agents\arbiter.mdC:\Users\cho\Desktop\Project\multi-agent-adversarial-verification\agents\orchestrator.mdCreates, edits, and optimizes skills for Claude Code, including drafting, evaluating with test prompts, iterating on performance, and improving skill descriptions for better triggering accuracy.
npx claudepluginhub cho1124/multi-agent-adversarial-verification --plugin adversarial-verify