From harness
피처 개발 하네스 오케스트레이터. /feature 명령으로 TDD 기반 Plan-Contract-Test-Build-Evaluate-Integrate-Learn 사이클을 실행. /feature --init, /feature --resume, /feature "설명" 을 요청할 때 사용.
How this skill is triggered — by the user, by Claude, or both
Slash command
/harness:harness-orchestratorThe summary Claude sees in its skill listing — used to decide when to auto-load this skill
피처 개발의 7-phase 파이프라인을 제어하는 오케스트레이터.
피처 개발의 7-phase 파이프라인을 제어하는 오케스트레이터.
/feature 호출 시 최우선으로 plugin 버전과 project 버전을 비교한다.
${CLAUDE_PLUGIN_ROOT}/.claude-plugin/plugin.json의 version 필드docs/harness/project-profile.md의 harness_version 필드 (없으면 "0.1.0"으로 간주)/feature --init --refresh로 프로젝트 프로파일을 갱신할 수 있습니다."--init 미실행 상태): 버전 체크 스킵/feature --init)프로젝트 프로파일링 및 하네스 초기화.
~/.claude/skills/ (로컬 설치된 skills)~/.claude/plugins/installed_plugins.json (로컬 설치된 plugins)claude-plugins-official)${CLAUDE_PLUGIN_ROOT}/templates/project-profile.md) 기반으로 생성 → docs/harness/project-profile.md에 저장Research Hints 섹션을 사용자에게 보여주고 도메인/관심 분야 입력 요청docs/harness/, docs/wisdom/, docs/wisdom/index.md 생성@docs/harness/project-profile.md, @docs/wisdom/index.md 추가--refresh 옵션 시: 기존 project-profile.md를 읽고 변경사항만 업데이트.
/feature --resume)중단된 피처 런 재개.
docs/harness/ 에서 가장 최근 미완료 harness-state.md 탐지/feature "설명")새 피처 개발 실행.
의존성 체크. 다음 항목을 검증:
Required Plugins: feature-dev, code-review, pr-review-toolkit, security-guidance Required Skills: superpowers:writing-plans, superpowers:test-driven-development, superpowers:subagent-driven-development, superpowers:verification-before-completion, superpowers:dispatching-parallel-agents, superpowers:finishing-a-development-branch, superpowers:requesting-code-review Project Type Dependencies:
xcrun simctl) / Android SDK검증 방법:
~/.claude/plugins/installed_plugins.json에서 확인~/.claude/skills/{name} 존재 확인누락 시: 목록 출력 + 설치 명령어 안내 → 사용자 승인 후 자동 설치 시도 → 재검증
docs/harness/{YYYY-MM-DD}-{feature-slug}/{run_dir}/research.md 저장docs/wisdom/research/{topic-slug}/research.md{run_dir}/exploration.md 저장architecture.md 작성project-profile.md 참조하여 기존 패턴/컨벤션 맥락 제공references/design-system-bootstrap.md 참조하여:
a. Design Brief 작성 (Purpose, Tone, Constraints, Differentiator) — 사용자와 함께 결정
b. ui-ux-pro-max skill로 Design System 생성:
impeccable /colorize → 색상 시스템 세부 조정
d. impeccable /typeset → 타이포그래피 시스템 구축
e. frontend-design skill → aesthetic direction 최종 결정
f. design-tokens를 Tailwind @theme 또는 CSS variables로 코드화
g. 결과를 docs/harness/{run-dir}/design-brief.md에 저장plan.md 저장${CLAUDE_PLUGIN_ROOT}/templates/contract.md) 기반으로 contract.md 생성{run_dir}/user-interview.md에 기록test-scenarios.md 저장iteration을 max_iterations(기본 5)까지 반복. Iteration 1은 전체 구현, Iteration 2+는 FAIL 피드백 기반 델타 수정.
BUILD 단계 — Iteration 1 (초기 구현):
impeccable — /arrange(레이아웃), /colorize(색상), /typeset(타이포), /animate(모션), /polish(디테일)ui-ux-pro-max — design-brief.md의 design system 참조frontend-design — anti-slop 가이드라인 준수BUILD 단계 — Iteration 2+ (델타 수정):
evaluations/iteration-{N-1}.md의 Detailed Feedback 읽기/arrange, /normalize/bolder, /overdrive, /delight/polish, /typeset, /colorize/clarify, /harden, /adaptEVALUATE 단계 (매 iteration 동일):
아래 step 1~2는 독립적으로 모두 실행한다. step 1의 테스트 결과와 무관하게 step 2는 반드시 수행해야 한다.
Agent tool로 design-evaluator agent를 dispatch한다. design-evaluator가 Playwright로 스크린샷 촬영 + 4축 디자인 평가 + token compliance 검증을 수행. 결과 스크린샷은 {run_dir}/screenshots/에 저장.Agent tool로 design-evaluator agent를 dispatch한다. SEO 검증 + 4축 평가 수행.impeccable /critique(UX 점수화 + 페르소나 테스트) + /audit(일관성 감사) 수행${CLAUDE_PLUGIN_ROOT}/templates/evaluation.md) 기반으로 evaluations/iteration-{N}.md 저장
### Verdict:, Test Results, - failing_criteria: 패턴을 파싱함코드 리뷰: code-review plugin으로 80+ confidence 리뷰 (최종 iteration 후).
docs/wisdom/ 하위에 카테고리별 저장docs/wisdom/index.md 자동 업데이트summary.md 생성 (피처 완료 요약)매 phase 전환 시 반드시 갱신. 다음 항목 업데이트:
원칙: 사용자에게 묻지 말고 자동으로 처리하라.
Context가 길어지면 품질이 급격히 저하된다 (Anthropic harness design 문서 참조). 사용자에게 "계속할까요?"라고 묻는 것은 불필요한 마찰이다.
Phase 전환 시 (PLAN→CONTRACT→TEST→BUILD 등):
BUILD 태스크 진행 중:
EVALUATE iteration 완료 시:
subagent 활용이 핵심:
harness-state.md가 보험:
/feature --resume로 정확히 이어서 진행모든 implementer subagent는 작업 완료 시 반드시 4가지 상태 중 하나로 종료해야 한다. subagent dispatch 시 이 프로토콜을 prompt에 포함할 것.
DONE — 구현 완료, 테스트 통과, 커밋함
DONE_WITH_CONCERNS — 완료했지만 의문점 있음 (구체적 concern 명시)
NEEDS_CONTEXT — 작업 전 질문 있음 (구체적 질문 명시)
BLOCKED — 진행 불가 (차단 사유 + 필요한 선행 작업 명시)
Orchestrator 분기:
DONE → spec-reviewer dispatchDONE_WITH_CONCERNS → concerns 검토 후 판단 (사소하면 진행, 심각하면 사용자에게 전달)NEEDS_CONTEXT → 사용자에게 질문 전달 → 답변 수신 → 동일 태스크 재dispatch (답변 포함)BLOCKED → 차단 사유 분석 → 의존 태스크 우선 처리 또는 사용자 개입 요청evaluator/reviewer가 generator(implementer)에게 피드백을 전달할 때, generator는 맹목적으로 수용하지 않는다.
피드백 수신 시 프로토콜:
금지:
적용 시점: Phase 4 BUILD 델타 수정에서 evaluator 피드백을 implementer에게 전달할 때.
비용 최적화를 위해 태스크 성격에 따라 모델을 선택한다. "좋은 scaffold의 Sonnet > 나쁜 scaffold의 Opus" (Confucius Code Agent 연구)
| 역할 | 모델 | 이유 |
|---|---|---|
| code-explorer | sonnet | 읽기/분석 전용, 빠르고 저렴 |
| code-architect | opus | 아키텍처 설계는 깊은 추론 필요 |
| contract-negotiator | opus | 평가 기준 설정은 판단력 필요 |
| test-architect | opus | 시나리오 도출은 깊은 추론 필요 |
| test-healer | sonnet | 진단은 패턴 매칭에 가까움 |
| implementer (subagent) | sonnet | 코드 생성은 scaffold가 보조 |
| spec-reviewer | sonnet | 체크리스트 기반 검증 |
| code-quality-reviewer | sonnet | 패턴 매칭 기반 리뷰 |
| design-evaluator | opus | 관대함 방지, 엄격한 판단 필요 |
| wisdom-extractor | sonnet | 읽기/분석 전용 |
agent frontmatter의 model: 필드가 이 가이드를 따라야 한다.
--parallel 플래그로 활성화. 기본 비활성.
/feature "로그인 페이지" --parallel
활성화 시 BUILD 단계에서 독립 태스크를 병렬 teammates로 실행:
CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1 필요주의: experimental 기능. 안정성 문제 발생 시 --parallel 없이 재실행.
하네스는 4가지 enforcement 레이어를 조합한다 (Martin Fowler 프레임워크).
| Feedforward (사전 방지) | Feedback (사후 자기교정) | |
|---|---|---|
| Computational (결정적) | harness-lint.sh — 매 Edit/Write 시 발화 | Structural tests — EVALUATE에서 실행 |
| Inferential (LLM 기반) | SKILL.md, agent .md, Skills | design-evaluator (LLM-as-Judge) |
hooks에서 호출되는 통합 린터. 모든 에러 메시지에 Fix: 행을 포함하여 agent가 자기 교정 가능.
사용법:
bash harness-lint.sh <run_dir> [contract|evaluation|state|test|screenshots|all]
검증 항목:
contract: 필수 섹션, threshold floor (≥7/10, ≥80%)evaluation: Verdict/Test Results/Score Evidence/failing_criteria 형식state: 필수 필드, phase 유효성test: 시나리오 문서 + 실제 코드 파일 + E2E (web)screenshots: web/content 프로젝트 스크린샷 존재에러 메시지 패턴 (OpenAI 방식):
[contract] functionality threshold가 5/10입니다 (floor: 7/10).
Fix: contract.md에서 | functionality | 행의 점수를 7/10 이상으로 수정하세요.
test-architect가 Phase 3에서 architecture.md 기반으로 작성. ArchUnit 스타일:
Provides behavioral guidelines to reduce common LLM coding mistakes, focusing on simplicity, surgical changes, assumption surfacing, and verifiable success criteria.
Searches, retrieves, and installs Agent Skills from prompts.chat registry using MCP tools like search_skills and get_skill. Activates for finding skills, browsing catalogs, or extending Claude.
Creates, edits, and optimizes skills for Claude Code, including drafting, evaluating with test prompts, iterating on performance, and improving skill descriptions for better triggering accuracy.
npx claudepluginhub gprecious/harness --plugin harness