Skill

validated-plan-qa

validated-plan 실행 결과 사후 감사. 3-layer 검증: Layer 1 (Chain Audit) 구조+의미 정합성, Layer 2 (Independent Verdict) 체인 우회 독립 판정, Layer 3 (Divergence Analysis) 체인 판정 vs 독립 판정 교차 검증. "validated-plan QA", "실행 끝난 거 QA" 요청에 사용.

Invocation

How this skill is triggered — by the user, by Claude, or both

Slash command

/validated-plan-qa:validated-plan-qa

User invocable

Model invocable

Inline context

Default effort

Context Preview

The summary Claude sees in its skill listing — used to decide when to auto-load this skill

validated-plan의 내장 검증(critic, meta-validation, gap 루프)이 **구조적으로 놓치는 것**을 잡는다.

Supporting Files

SKILL.md

408 lines · ~2.8k tokens

Stats

LanguagePython

Stars0

MaintenanceExcellent

Last CommitApr 9, 2026

Actions

View Source View Plugin View on GitHub View README

Stats

Actions

Validated Plan QA

validated-plan의 내장 검증(critic, meta-validation, gap 루프)이 구조적으로 놓치는 것을 잡는다. 내장 검증의 맹점: 프레이밍 오염, 점진적 앵커링, 기준 약화, 매니페스트 ≠ 실제.

3-Layer 아키텍처

              validated-plan 실행 완료
                      |
            +---------+---------+
            v         v         v
        Layer 1    Layer 2    Layer 3
      Chain Audit  Independent  Divergence
      (정합성)     Verdict      Analysis
                   (독립 판정)   (교차 검증)
            |         |         |
            +---------+---------+
                      v
                Final Report

사전 조건

.omc/plans/{task-slug}/ 디렉토리가 존재한다
최소한 clarify-result.md와 execution-review.md(또는 execution-review-r{N}.md)가 있다
프로젝트 루트를 식별할 수 있다

Layer 1: Chain Audit (구조 + 의미 정합성)

orchestration-silent-failure-inspector의 구조 검사를 흡수하고, 의미 검사를 추가한다.

1-A. 스크립트 실행 (구조 검사)

python3 "${CLAUDE_PLUGIN_ROOT}/skills/validated-plan-qa/scripts/audit_validated_plan_run.py" .omc/plans/{task-slug} --repo-root .

스크립트가 검사하는 것:

필수 산출물 존재 + 비어있지 않음
slug 일관성 (디렉토리 ↔ 파일 헤더)
gap 루프 파일 쌍 정합성
execution-manifest 변경파일/매핑/worktree 교차검증
clarify-result 필수 섹션 존재
plan-v2 Core 태그 + 수락 기준 존재

1-B. 의미 참조 검증 (에이전트가 직접 수행)

스크립트 결과를 확인한 뒤, references/rubrics.md의 해당 R-check 규칙과 사례를 읽고, 아래 5개 참조 연결을 파일 내용을 읽어서 검증한다. 각 R-check의 PASS/FAIL/WARN 판정은 rubrics.md의 규칙을 따른다.

#	생산자	소비자	확인 내용
R-1	`clarify-result.md` 성공 기준	`validation-v2.md` 결과 기준	clarify 성공 기준 각각이 validation 기준에 매핑되는가
R-2	`meta-evaluation.md` fail 항목	`validation-v2.md` v1→v2 변경점	meta에서 fail된 것이 v2에서 실제로 개선됐는가
R-3	`plan-v1-review.md` 수정 포인트	`plan-v2.md` Changelog	리뷰 수정 포인트가 plan-v2에 반영됐는가
R-4	`validation-v1.md` 기준	`validation-v2.md` 기준	기준이 강화만 됐는가, 약화된 건 없는가
R-5	`execution-review.md` Gap 목록	`gap-plan-r1.md`	Gap이 있으면 보완 계획이 있는가, Gap 내용이 일치하는가

R-4 (기준 약화 감지)가 핵심이다. validation-v1에서 v2로 넘어갈 때, 또는 gap 루프에서 재검증할 때 기준을 느슨하게 재해석하면 false pass가 된다.

기준 약화 판정법:

v1의 임계값이 v2에서 낮아졌는가 (예: "3개 이상" → "1개 이상")
v1에 있던 기준이 v2에서 삭제됐는가
v2 테스트셋의 fail 케이스가 v1보다 관대해졌는가

1-C. Gap 루프 정직성 검증

gap 루프가 있었다면 (execution-review-r1.md 등 존재):

execution-review.md에서 fail이던 항목을 추출
execution-review-r1.md에서 해당 항목의 판정을 확인
fail → pass로 바뀐 항목에 대해:
- output이 바뀌었는가 (실제 파일 변경이 있는가)
- 해석이 바뀌었는가 (같은 output에 대해 판정만 바뀌었는가)
해석만 바뀐 경우 → finding: "gap loop resolved by reinterpretation, not by improvement"

Layer 2: Independent Verdict (독립 판정)

validated-plan은 에이전트를 분리(planner, critic, architect, executor)하지만, 정보 체인은 하나다. 앞 단계의 산출물이 뒷 단계의 입력이 되므로, Step 1에서 프레이밍이 잘못되면 이후 전체가 오염된다. 특히 기준 약화(validation v1→v2)는 같은 critic이 담당하므로 구조적으로 가능하다.

Independent Verdict는 이 계획-검증-실행 체인(Step 1~10)을 우회하고 재판정한다.

한계: Step 0(Clarify)의 오염은 못 잡는다. Layer 2가 "원래 의도"로 사용하는 clarify-result.md는 체인의 첫 산출물이다. Step 0에서 사용자 의도를 잘못 해석했으면, 독립 판정도 그 해석 위에서 이뤄진다. 즉 이 Layer는 Step 1~10의 프레이밍 오염은 잡지만, Step 0의 오염은 잡지 못한다. 향후 validated-plan에서 사용자 원문을 별도 보존(user-request-raw.md)하면 이 한계를 해소할 수 있다.

실행 방법

Agent(subagent_type="oh-my-claudecode:critic", model="opus")

이 agent에게 주는 것:

clarify-result.md (원래 의도 — Step 0 한계 인지 필요)
최종 산출물 (execution-manifest.md에 나열된 실제 코드/파일)

이 agent에게 주지 않는 것:

plan-v1.md, plan-v2.md
validation-v1.md, validation-v2.md
meta-evaluation.md
execution-review.md, execution-review-r{N}.md
plan-v1-review.md
gap-plan-r{N}.md

프롬프트:

너는 이 프로젝트의 실행 과정을 전혀 모른다.
사용자의 원래 의도와 최종 결과물만 본다.

[clarify-result.md 경로]를 읽어라. 이것이 원래 의도다.
[execution-manifest.md에 나열된 실제 변경 파일 경로들]을 읽어라. 이것이 최종 결과물이다.

아래 3가지를 판정하라:

1. 명시적 성공 기준 충족
   clarify-result의 "성공 기준" 섹션의 각 항목에 대해:
   최종 결과물이 이 기준을 충족하는가? (PASS/FAIL + 근거)

2. 암묵적 기대 충족
   이 의도를 가진 사람이 당연히 기대하지만 명시하지 않은 것:
   충족되는가? (PASS/FAIL + 근거)
   항목이 없으면 "식별된 암묵적 기대 없음"

3. 과잉/이탈 산출물
   최종 결과물에서 의도와 무관하거나 과잉인 것:
   있는가? (목록 + 왜 과잉인지)
   없으면 "과잉 산출물 없음"

최종 독립 판정: PASS / PARTIAL / FAIL

critic은 read-only이므로, 결과를 받은 후 오케스트레이터가 .omc/plans/{task-slug}/independent-verdict.md에 저장한다.

Layer 3: Divergence Analysis (교차 검증)

Layer 1과 Layer 2 결과를 비교하여 최종 판정을 내린다.

입력

체인 판정: 최신 execution-review (execution-review.md 또는 execution-review-r{N}.md)
독립 판정: independent-verdict.md

판정 매트릭스

체인 판정	독립 판정	의미	최종 verdict
PASS	PASS	높은 신뢰도	PASS
PASS	PARTIAL	체인이 일부 놓침	CONDITIONAL PASS — 독립 판정의 FAIL 항목 상세 기술
PASS	FAIL	Silent failure 확정	FAIL — 체인이 놓친 것을 구체적으로 기술
PARTIAL	PASS	체인이 과잉 엄격	CONDITIONAL PASS — 기준 재검토 권고
PARTIAL	PARTIAL	양쪽 모두 부족 인식	CONDITIONAL PASS — 합집합 Gap 기술
PARTIAL	FAIL	실행 미완	FAIL
FAIL	PASS	체인 기준 오류 가능	CONDITIONAL PASS — 기준 재검토 권고
FAIL	FAIL	실행 자체 실패	FAIL

Layer 1 오버라이드

Layer 1에서 아래 중 하나라도 해당하면, Layer 2/3 결과와 무관하게 FAIL:

필수 산출물 누락
gap 루프 파일 정합성 깨짐
기준 약화 감지
gap 루프에서 해석만 변경하여 pass 처리

자기 강화: 불일치 사례 축적

Layer 1과 Layer 2의 판정이 같은 영역에서 불일치하면, references/rubrics.md의 해당 항목 사례란에 아래 형식으로 추가한다:

- {날짜}: Layer 1 {판정}, Layer 2 {판정}
  상황: {무엇이 어떻게 달랐는지}
  원인: {왜 어긋났는지}
  교훈: {다음에 어떻게 판정해야 하는지}

사례 추가 직후, 해당 R-check의 사례 수를 확인한다:

같은 교훈이 3회 이상 반복되면 → 해당 항목의 규칙에 반영하고, 반영된 사례는 삭제한다
미만이면 → 넘어간다

보고 형식

# Validated Plan QA: {task-slug}

## Layer 1: Chain Audit
### 구조 검사 (스크립트)
[스크립트 출력 요약]

### 의미 참조 검증
| # | 생산자 → 소비자 | 판정 | 근거 |
|---|----------------|------|------|

### Gap 루프 정직성
[해당 시 결과]

### Layer 1 종합: PASS / FAIL
[FAIL이면 finding 목록]

## Layer 2: Independent Verdict
### 명시적 성공 기준
| 기준 | 판정 | 근거 |

### 암묵적 기대
[결과]

### 과잉/이탈 산출물
[결과]

### 독립 판정: PASS / PARTIAL / FAIL

## Layer 3: Divergence Analysis
- 체인 판정: [PASS/PARTIAL/FAIL]
- 독립 판정: [PASS/PARTIAL/FAIL]
- 일치 여부: [일치 / 불일치]
- 불일치 시 분석: [체인이 놓친 것 / 체인이 과잉인 것]

## Final Verdict: PASS / CONDITIONAL PASS / FAIL
- [verdict 근거 1-2문장]
- [CONDITIONAL이면 missing evidence / 권고사항]
- [FAIL이면 blocking finding 목록]

CONDITIONAL PASS 해소 루프

Final Verdict가 CONDITIONAL PASS 또는 FAIL일 때, QA를 보고서 작성으로 끝내지 않는다. Blocking finding이 해소될 때까지 아래 루프를 실행한다.

트리거

Final Verdict가 CONDITIONAL PASS 또는 FAIL이고, blocking finding(심각도 CRITICAL 또는 MAJOR)이 1건 이상 존재.

루프

Final Verdict: CONDITIONAL PASS / FAIL
        │
        ▼
  Blocking findings 목록 추출
        │
        ▼
  사용자에게 보고 + 수정 여부 확인
        │
        ├── 사용자 "수정해" → 수정 실행 → 재검증 (Layer 2 재실행)
        │                                    │
        │                              PASS → 종료
        │                              아직 blocking → 루프 반복
        │
        └── 사용자 "나중에" / "스킵" → QA 보고서에 "미해소" 기록 후 종료

재검증 방법

수정 완료 후 Layer 2(Independent Verdict)만 재실행한다.

전체 3-Layer를 다시 돌리지 않는다 (Layer 1은 체인 정합성이므로 수정과 무관)
독립 판정이 PASS로 바뀌면 Final Verdict를 PASS로 갱신
독립 판정이 여전히 PARTIAL/FAIL이면 남은 blocking finding을 보고하고 루프 반복

보고서 갱신

해소 완료 시 qa-report.md와 metadata.md를 갱신한다:

- final-verdict: CONDITIONAL PASS → PASS (resolved)
- resolution-date: YYYY-MM-DD
- resolved-findings: [목록]

미해소 종료 시:

- final-verdict: CONDITIONAL PASS (unresolved)
- unresolved-findings: [목록]

Learning Loop: 놓친 문제를 규칙으로 바꾸기

3-Layer QA는 구조적 맹점이 있다. 이 루프는 QA가 놓친 문제를 사후에 수집하고, 데이터가 쌓이면 규칙으로 승격하는 메커니즘이다.

QA 실행 ──→ PASS/CONDITIONAL ──→ ... 시간 경과 ...
                                        │
                                  문제 사후 발견
                                        │
                                        ▼
                              missed-patterns.md에 기록
                                        │
                                  엔트리 축적 (>= 5개)
                                        │
                                        ▼
                              pattern-analyst 분석
                                        │
                                        ▼
                              regression-verifier 검증
                                        │
                                  통과 시 규칙 승격
                                        ▼
                              references/ 또는 scripts/ 반영

Intake: 사후 발견 기록

트리거 (아래 중 하나에 해당하면 즉시 기록):

사용자가 "이전 QA에서 놓친 게 있었다"고 보고
후속 작업 중 이전 validated-plan 산출물의 결함 발견
프로덕션에서 QA PASS된 코드의 버그/장애 발생
다른 리뷰어가 QA가 놓친 문제를 지적

기록 위치: references/missed-patterns.md 기록 주체: 문제를 발견한 세션의 오케스트레이터가 즉시 기록 엔트리 형식: missed-patterns.md 참조

QA Archive: 회귀 검증용 과거 데이터

QA 실행 완료 후, 회귀 검증에 사용할 수 있도록 결과를 아카이브한다.

저장 위치: .omc/qa-archive/{task-slug}/

저장 시점: Final Report 작성 직후 (실행 순서 8번 완료 시)

저장 대상:

파일	필수	용도
`final-qa-report.md`	O	최종 보고서 원본
`independent-verdict.md`	O	Layer 2 독립 판정
`layer1-findings.md`	O	Layer 1 finding 목록
`metadata.md`	O	아래 메타데이터

metadata.md 형식:

- task-slug: {slug}
- qa-date: YYYY-MM-DD
- final-verdict: PASS / CONDITIONAL PASS / FAIL
- chain-verdict: PASS / PARTIAL / FAIL
- independent-verdict: PASS / PARTIAL / FAIL
- divergence: 일치 / 불일치
- plan-dir: .omc/plans/{task-slug}/
- 사후 발견 여부: 미확인 (나중에 갱신)

보존 기간: 무기한. qa-archive는 누적 데이터가 가치이므로 삭제하지 않는다.

사후 발견 시 갱신: missed-patterns.md에 해당 task-slug 관련 엔트리가 추가되면, metadata.md의 "사후 발견 여부"를 "있음 — MISSED-{ID} 참조"로 갱신한다.

규칙 승격

승격 기준, 절차, 에이전트 활성화 임계값은 references/promotion-rules.md 참조.

핵심 원칙:

발견자 != 규칙 확정자
SKILL.md보다 references/와 scripts/를 먼저 강화
1회성 사례는 규칙화하지 않음
데이터(missed-patterns >= 5개)가 쌓인 뒤에만 에이전트 분석 실행

향후 에이전트 (임계값 충족 시 추가)

에이전트	활성화 조건	역할
pattern-analyst	missed-patterns 엔트리 >= 5개	누락 패턴 분석 + 규칙 추가안 작성
regression-verifier	rule-update-proposal 존재 + qa-archive 사례 >= 2개	새 규칙의 과적합/오탐 검증

실행 순서 (갱신)

task-slug와 repo root를 식별한다
Layer 1-A: 스크립트 실행 → 구조 finding 수집
Layer 1-B: 5개 참조 연결을 파일 읽기로 검증 → 의미 finding 수집
Layer 1-C: gap 루프 정직성 검증 → finding 수집
Layer 1에 FAIL-grade finding이 있으면 → Layer 1 FAIL 보고 후 Layer 2로 계속 진행
Layer 2: Independent Verdict agent 스폰 → 독립 판정 수집
Layer 3: 체인 판정 vs 독립 판정 비교 → 최종 verdict 결정
Final Report 작성
QA Archive: .omc/qa-archive/{task-slug}/에 결과 보존

Layer 1 FAIL이어도 Layer 2는 실행한다. 독립 판정은 체인 상태와 무관하게 가치가 있다.

참조 문서

체크리스트: references/checklist.md
실패 taxonomy: references/failure-taxonomy.md
verdict 규칙: references/verdict-rules.md
놓친 패턴 레지스트리: references/missed-patterns.md
규칙 승격 기준: references/promotion-rules.md
rubric (판정 기준): references/rubrics.md
fixture (rubric 검증용 모의고사): fixtures/README.md

validated-plan-qa

Invocation

Context Preview

Supporting Files

SKILL.md

validated-plan-qa

Invocation

Context Preview

Supporting Files

SKILL.md

Validated Plan QA

3-Layer 아키텍처

사전 조건

Layer 1: Chain Audit (구조 + 의미 정합성)

1-A. 스크립트 실행 (구조 검사)

1-B. 의미 참조 검증 (에이전트가 직접 수행)

1-C. Gap 루프 정직성 검증

Layer 2: Independent Verdict (독립 판정)

실행 방법

Layer 3: Divergence Analysis (교차 검증)

입력

판정 매트릭스

Layer 1 오버라이드

자기 강화: 불일치 사례 축적

보고 형식

CONDITIONAL PASS 해소 루프

트리거

루프

재검증 방법

보고서 갱신

Learning Loop: 놓친 문제를 규칙으로 바꾸기

Intake: 사후 발견 기록

QA Archive: 회귀 검증용 과거 데이터

규칙 승격

향후 에이전트 (임계값 충족 시 추가)

실행 순서 (갱신)

참조 문서

Similar Skills

Validated Plan QA

3-Layer 아키텍처

사전 조건

Layer 1: Chain Audit (구조 + 의미 정합성)

1-A. 스크립트 실행 (구조 검사)

1-B. 의미 참조 검증 (에이전트가 직접 수행)

1-C. Gap 루프 정직성 검증

Layer 2: Independent Verdict (독립 판정)

실행 방법

Layer 3: Divergence Analysis (교차 검증)

입력

판정 매트릭스

Layer 1 오버라이드

자기 강화: 불일치 사례 축적

보고 형식

CONDITIONAL PASS 해소 루프

트리거

루프

재검증 방법

보고서 갱신

Learning Loop: 놓친 문제를 규칙으로 바꾸기

Intake: 사후 발견 기록

QA Archive: 회귀 검증용 과거 데이터

규칙 승격

향후 에이전트 (임계값 충족 시 추가)

실행 순서 (갱신)

참조 문서

Similar Skills