[Harness Engineering] 도메인별 하네스 템플릿

REST API 백엔드, 프론트엔드 웹 애플리케이션, 데이터 파이프라인 세 가지 도메인에 맞춘 완결된 하네스 템플릿을 제공한다. 각 템플릿은 CLAUDE.md, 에이전트 정의, 스킬 파일, 의존성 규칙, 테스트 전략을 포함하며, 복사 후 프로젝트에 맞게 커스터마이징하여 사용할 수 있다. 하네스는 프레임워크가 아니라 패턴이며, 프로젝트와 함께 진화한다.

[Harness Engineering] 하네스 구조 해부

하네스의 물리적 구조는 오케스트레이터(CLAUDE.md), 전문 에이전트 정의(agents/.md), 스킬 파일(skills//skill.md), 상태 추적(feature-list.json, progress.md)의 네 계층으로 구성된다. 각 파일은 독립적이지 않고 서로 참조·연결되어 하나의 시스템을 이루며, 에이전트가 역할을 나누고, 규칙을 따르고, 일관된 품질을 유지하며 작업할 수 있는 환경을 만든다.

[Harness Engineering] 실제 사례 비교

OpenAI(인간 코드 0줄로 100만 줄 프로덕션 구축), Anthropic(장기 실행 에이전트의 세션 간 기억 문제 해결), Stripe(주당 1,000+ PR을 기존 품질 기준으로 운영)는 서로 다른 질문에서 출발했지만, 환경 중심 설계, 점진적 작업, 기계적 강제, 피드백 채널 제공이라는 동일한 원칙에 수렴했다. 조직의 맥락에 따라 세 모델을 선택적으로 조합하는 것이 가장 효과적이다.

[Harness Engineering] 실패 패턴과 안티패턴

하네스 엔지니어링의 다섯 가지 주요 안티패턴은 천 페이지 매뉴얼(과도한 규칙), 과도한 제어 흐름(절차 정의), 도구 과다 제공, 실패를 모델 탓으로 돌리기, 하네스 오버엔지니어링이다. 공통 해결 원칙은 에이전트가 실수할 때마다 그 실수를 구조적으로 불가능하게 만드는 해결책을 코드로 반영하는 것이며, 하네스는 완성되는 것이 아니라 실패를 연료로 진화하는 것이다.

[Harness Engineering] 단계별 구축 가이드

하네스 구축은 규모에 맞게 단계적으로 접근해야 한다. Level 1(개인)은 CLAUDE.md + pre-commit 훅 + 기존 테스트 유지로 30분이면 충분하다. Level 2(소규모 팀)는 아키텍처 테스트, CI 파이프라인, 계층적 CLAUDE.md를 추가한다. Level 3(조직)은 엔트로피 점수 산출, 건강도 게이트, 주간 자동 리포트까지 확장한다. 핵심은 현재 규모에서 가장 아픈 문제를 해결하는 수준으로 도입하는 것이다.

[Harness Engineering] 피드백 루프

피드백 루프는 에이전트가 코드 작성 결과를 직접 확인하고 자율적으로 수정하는 순환 구조를 만드는 하네스의 네 번째 기둥이다. Puppeteer 기반 E2E 테스트로 사용자 관점 검증, 관찰 가능성 스택으로 로그·메트릭 직접 쿼리, 단계별 CI 파이프라인으로 모든 피드백을 통합한다. 에이전트에게 “눈과 귀”를 제공함으로써 코드 수준이 아닌 실행 수준의 품질을 보장한다.

[Harness Engineering] 엔트로피 관리

엔트로피 관리는 아키텍처 제약이 잡아내지 못하는 불일치 — 코드 중복, 패턴 불일치, 죽은 코드, 문서-코드 괴리 — 를 자동으로 탐지하고 정리하는 하네스의 세 번째 기둥이다. jscpd, knip, AST 기반 유사 함수 스캐너, 문서-코드 일관성 검증 스크립트를 CI/CD와 스케줄링된 워크플로우로 통합하여 코드베이스의 건강을 지속적으로 유지한다.

[Harness Engineering] 아키텍처 제약

아키텍처 제약은 컨텍스트 엔지니어링이 ‘안내’하는 것을 ‘강제’로 전환하는 하네스의 두 번째 기둥이다. 의존성 방향 테스트, 순환 의존성 감지, 커스텀 린터 규칙, pre-commit 훅, 데이터 경계 파싱 강제를 통해 에이전트의 판단과 무관하게 규칙이 지켜지는 구조를 만든다. 핵심 철학은 불변 규칙은 기계적으로 강제하되 구현 방식은 자유롭게 두는 것이다.

[Harness Engineering] 컨텍스트 엔지니어링

컨텍스트 엔지니어링은 AI 에이전트가 올바른 결과물을 만들기 위해 필요한 정보를 구조화하고 제공하는 기술이다. 구체적인 규칙 파일(AGENTS.md), 계층적 구조, JSON 기반 기능 목록, 파일시스템 기반 진행 로그, 초기화 스크립트를 통해 에이전트에게 추측이 아닌 읽기를 시킨다. 핵심 원칙은 저장소가 단일 진실 소스가 되어야 한다는 것이다.

[Harness Engineering] 하네스 엔지니어링이란 무엇인가

하네스 엔지니어링은 AI 에이전트가 대규모로 안정적인 결과물을 만들 수 있도록 환경, 제약, 피드백 루프를 설계하는 분야다. 프롬프트가 부탁이라면 하네스는 강제이며, OpenAI·Anthropic·Stripe가 독립적으로 같은 결론에 도달했다. 핵심은 컨텍스트 엔지니어링, 아키텍처 제약, 엔트로피 관리의 세 기둥이다.