레딧사례●Claude Code
원본으로 →[레딧-클로드코드] 레딧발 Claude Code 유출 소스에서 뽑아낸 에이전트 설계 특징 5가지
Claude Code 유출 소스를 분석해 에이전트의 특징을 추출하고 논의된 댓글에 대해 요약함.
노
노예1호2026.04.05조회 74
★ 5.0 (1명)|내 평가
로그인 이후 사용할 수 있습니다
로그인 이후 사용할 수 있습니다
CLAUDE.md 재주입과 회의적 메모리
- CLAUDE.md는 시작 시 한 번만 로드되는 것이 아니라, 매 턴 전환마다 다시 삽입된다.
사용자가 새 메시지를 보낼 때마다 지침이 사용자 메시지 근처에 재주입되므로, 잘 구조화된 CLAUDE.md가 지속적으로 강한 영향을 준다 - 에이전트는 자기 기억을 팩트가 아니라 힌트로 취급한다.
기억한 내용을 실행하기 전에 실제 코드베이스로 다시 검증하는 방식이다 - 따라서 CLAUDE.md를 쓸 때도, 회상된 정보를 바로 신뢰하지 말고 행동 전에 검증하라는 규칙을 넣는 것이 유효하다
서브 에이전트와 프롬프트 캐시 공유
- 워커 에이전트들은 서로 완전히 독립된 프롬프트를 쓰는 것이 아니라, 같은 컨텍스트 prefix를 공유하고 작업별 지시문에서만 분기한다
- 이 구조 덕분에 멀티 에이전트 협업이 입력 토큰 비용 5배로 곧바로 늘어나지는 않는다
- 다만 비용 자체는 여전히 크며, 이런 점이 Coordinator Mode가 아직 정식 출시되지 않은 이유 중 하나로 보인다
컨텍스트 압축 전략 5종
- 컨텍스트가 가득 차면 이를 줄이기 위한 압축 전략이 다섯 가지 존재한다
- 압축 이후 작업 맥락을 잃어버리는 문제는 내부적으로도 완전히 해결되지 않은 문제로 보인다
프롬프트 캐시 무효화 요소 14종
- 시스템은 프롬프트 캐시를 깨는 요소를 14가지 벡터로 추적한다
- 모드 전환, 모델 변경, 컨텍스트 수정 같은 변화가 각각 캐시를 무효화할 수 있다
- 세션 중간에 모델을 바꾸거나, plan mode를 켰다 껐다 하면 원래 캐시될 수 있었던 구간까지 다시 전체 토큰 비용을 내게 된다
하네스 성능에 대한 의외의 결과
- Claude Code는 terminal bench에서 39위, Opus 기준으로는 하네스들 중 사실상 최하위권이었다
- 같은 Opus 모델이라도 Cursor의 하네스는 성능을 **77% → 93%**까지 끌어올렸지만, Claude Code는 77%에 머물렀다
- 즉, 이 비교 기준에서는 하네스 자체가 성능 향상에 거의 기여하지 못한 셈이다
Open Code 참조 흔적
- 유출된 소스에는 Open Code에 대한 참조가 들어 있었다
- Anthropic이 중단 요청을 보냈던 오픈소스 프로젝트의 구현을, 스크롤 동작을 맞추기 위해 참고하고 있었던 것이다
- 결과적으로 클로즈드 소스 도구가 오픈소스 도구의 동작을 따라 하고 있었던 셈이라, 다소 아이러니한 장면이다
커뮤니티 인사이트 (댓글)
- CLAUDE.md가 매 턴마다 재주입된다는 설명은 과도한 단순화라는 지적이 있었고, 저자도 인정함. 프록시를 걸어보면 매 턴 주입이 아님을 확인할 수 있다. 핵심은 "재주입"이 아니라 "지속적 컨텍스트 유지"
- OpenClaw에서 Anthropic API를 직접 사용하면 중간 정도 일일 사용량으로 월 $1,500 수준. CC Max 구독 대비 비용 차이가 크다
- 에이전트 작업에서는 Claude가 GPT를 압도하지만, 코드 분석 같은 단발 작업에서는 GPT 5.4가 더 나을 수 있다는 평가
에이전트 설계에서 메모리 검증·캐시 공유·컴팩션 전략을 구현하려는 개발자와, CC 토큰 비용을 최적화하려는 사용자가 참고할 수 있다.
댓글 0
로그인 이후 사용할 수 있습니다