레딧사례●Claude Code
원본으로 →[레딧-오픈코드] 스킬 2,004개 환경에서 시작 토큰 많이 절감한 SkillPointer 패턴 (라우터 패턴을 앞에 뒀대요)
AI 에이전트 스킬 2,004개를 설치한 환경에서 시작 토큰 80K→255으로 줄인 SkillPointer 패턴 — 스킬을 숨긴 vault에 이동하고 카테고리 포인터 35개로 on-demand 탐색
노
노예1호2026.03.25조회 73
★ 0.0 (0명)|내 평가
로그인 이후 사용할 수 있습니다
로그인 이후 사용할 수 있습니다
AI 에이전트(OpenCode/Claude Code)는 세션 시작 시 설치된 모든 스킬의 이름+설명을 시스템 프롬프트에 로드한다.
스킬이 2,004개면 시작만으로 ~80,000 토큰을 소비하며, 200K 컨텍스트 윈도우의 40%가 사라진다.
SkillPointer — 라우팅 패턴으로 토큰 절감
- 2,004개 스킬을 에이전트 스캔 경로 밖의 vault 디렉토리로 이동
- vault 대신 35개 카테고리 포인터 스킬을 배치
- 각 포인터는 AI에게 "list_dir과 view_file로 vault를 탐색해서 필요한 스킬을 찾으라"고 지시
- 결과: 시작 토큰 ~80,000 → ~255 (99.7% 감소), 접근 가능한 스킬 수는 동일
RAG/벡터 검색 대신 텍스트 라우팅을 쓰는 이유
- 순수 벡터 검색은 semantic failure가 발생함. "stretchy IK arm 만들어줘"라고 하면 IK 관련 문서는 찾지만, "Naming Conventions" 문서는 수학적 유사도가 없어서 놓침
- SkillPointer를 strict text router로 앞단에 두고, 실제 deep-dive가 필요할 때만 Qdrant MCP로 semantic search를 수행하는 레이어 구조
1M 컨텍스트 윈도우가 해결해주지 않는 이유
- "Lost in the Middle" 논문(arXiv:2307.03172)에 따르면, 모델은 긴 컨텍스트를 효과적으로 활용하지 못함
- 1M 토큰은 검색, 비용, 노이즈 문제를 오히려 악화시킴
커뮤니티 인사이트 (댓글)
- MCP는 "context vampire"임. 수백 개 tool/skill이 활성화되면 JSON schema 정의만으로 컨텍스트의 80%를 소비함. SkillPointer로 앞단에서 필터링하면 AI가 실제 필요한 tool 하나의 schema만 로드함
- 스킬이 "무시당하는" 문제도 같은 원인임. 디폴트 retrieval 메커니즘이 스킬을 전부 로드해서 컨텍스트가 오염되기 때문. 격리된 컨텍스트에서는 모델이 스킬을 100% 따름
- Claude Code에서도 같은 패턴이 적용 가능하나, 스킬 로딩 경로가 다르고 캐싱 이슈가 있어 추가 검증이 필요한 상태
대규모 스킬 환경에서 토큰 효율화를 고민하거나, 스킬이 무시되는 문제를 겪고 있는 경우 참고할 수 있다.
댓글 0
로그인 이후 사용할 수 있습니다