19. 빠른 모드로 응답 속도 높이기
/fast 활성화·비용 차이·노력 수준 조합·폴백 등 빠른 모드 활용 가이드
빠른 모드로 응답 속도 높이기
빠른 모드를 전환하여 Claude Code에서 더 빠른 Opus 4.6 응답을 받으세요.
참고: 빠른 모드는 리서치 프리뷰 상태입니다. 피드백에 따라 기능, 가격 및 제공 여부가 변경될 수 있습니다.
빠른 모드는 Claude Opus 4.6의 고속 구성으로, 토큰당 비용이 더 높지만 모델 속도를 2.5배 빠르게 만듭니다. 빠른 반복 작업이나 실시간 디버깅 같은 인터랙티브 작업에서 속도가 필요할 때 /fast로 켜고, 비용이 지연 시간보다 중요할 때 끄세요.
빠른 모드는 다른 모델이 아닙니다. 동일한 Opus 4.6를 비용 효율성보다 속도를 우선시하는 다른 API 구성으로 사용합니다. 동일한 품질과 기능을 제공하며, 응답만 더 빠릅니다.
알아야 할 사항:
- Claude Code CLI에서
/fast를 사용하여 빠른 모드를 전환하세요. Claude Code VS Code Extension에서도/fast로 사용 가능합니다. - Opus 4.6 빠른 모드 가격은 $30/150 MTok부터 시작합니다. 빠른 모드는 2월 16일 오후 11시 59분(PT)까지 모든 플랜에서 50% 할인으로 제공됩니다.
- 구독 플랜(Pro/Max/Team/Enterprise) 및 Claude Console의 모든 Claude Code 사용자가 이용 가능합니다.
- 구독 플랜(Pro/Max/Team/Enterprise)의 Claude Code 사용자의 경우, 빠른 모드는 추가 사용량으로만 제공되며 구독 요금제 한도에 포함되지 않습니다.
이 페이지에서는 빠른 모드 전환, 비용 트레이드오프, 사용 시점, 요구 사항, 세션별 옵트인, 속도 제한 동작을 다룹니다.
빠른 모드 전환
다음 두 가지 방법으로 빠른 모드를 전환할 수 있습니다:
/fast를 입력하고 Tab을 눌러 켜거나 끄기- 사용자 설정 파일에서
"fastMode": true로 설정
기본적으로 빠른 모드는 세션 간에 유지됩니다. 관리자는 빠른 모드가 매 세션마다 초기화되도록 구성할 수 있습니다. 자세한 내용은 세션별 옵트인 요구를 참조하세요.
최적의 비용 효율성을 위해 대화 중간이 아닌 세션 시작 시 빠른 모드를 활성화하세요. 자세한 내용은 비용 트레이드오프 이해를 참조하세요.
빠른 모드를 활성화하면:
- 다른 모델을 사용 중인 경우, Claude Code가 자동으로 Opus 4.6로 전환합니다
- 확인 메시지가 표시됩니다: "Fast mode ON"
- 빠른 모드가 활성화된 동안 프롬프트 옆에 작은
↯아이콘이 나타납니다 - 언제든지
/fast를 다시 실행하여 빠른 모드의 켜짐/꺼짐 여부를 확인할 수 있습니다
/fast를 다시 실행하여 빠른 모드를 비활성화하면 Opus 4.6에 그대로 유지됩니다. 이전 모델로 되돌아가지 않습니다. 다른 모델로 전환하려면 /model을 사용하세요.
비용 트레이드오프 이해
빠른 모드는 표준 Opus 4.6보다 토큰당 가격이 높습니다:
| 모드 | 입력 (MTok) | 출력 (MTok) |
|---|---|---|
| Opus 4.6 빠른 모드 (<200K) | $30 | $150 |
| Opus 4.6 빠른 모드 (>200K) | $60 | $225 |
빠른 모드는 1M 토큰 확장 컨텍스트 윈도우와 호환됩니다.
대화 중간에 빠른 모드로 전환하면, 전체 대화 컨텍스트에 대해 빠른 모드의 캐시되지 않은 입력 토큰 가격을 전액 지불하게 됩니다. 이는 처음부터 빠른 모드를 활성화했을 때보다 비용이 더 많이 듭니다.
빠른 모드 사용 시점 결정
빠른 모드는 비용보다 응답 지연 시간이 중요한 인터랙티브 작업에 가장 적합합니다:
- 코드 변경의 빠른 반복
- 실시간 디버깅 세션
- 촉박한 마감 기한의 시간에 민감한 작업
표준 모드가 더 적합한 경우:
- 속도가 덜 중요한 장기 자율 작업
- 배치 처리 또는 CI/CD 파이프라인
- 비용에 민감한 워크로드
빠른 모드 vs 노력 수준
빠른 모드와 노력 수준은 모두 응답 속도에 영향을 미치지만, 방식이 다릅니다:
| 설정 | 효과 |
|---|---|
| 빠른 모드 | 동일한 모델 품질, 낮은 지연 시간, 높은 비용 |
| 낮은 노력 수준 | 적은 사고 시간, 빠른 응답, 복잡한 작업에서 품질이 낮아질 가능성 있음 |
두 가지를 결합할 수 있습니다: 단순한 작업에서 최대 속도를 위해 빠른 모드와 낮은 노력 수준을 함께 사용하세요.
요구 사항
빠른 모드는 다음 모든 조건을 충족해야 합니다:
- 타사 클라우드 제공업체에서는 사용 불가: 빠른 모드는 Amazon Bedrock, Google Vertex AI 또는 Microsoft Azure Foundry에서 사용할 수 없습니다. 빠른 모드는 Anthropic Console API를 통해, 그리고 추가 사용량을 사용하는 Claude 구독 플랜에서 이용 가능합니다.
- 추가 사용량 활성화: 계정에 추가 사용량이 활성화되어 있어야 하며, 이는 플랜에 포함된 사용량을 초과한 청구를 허용합니다. 개인 계정의 경우 Console 청구 설정에서 활성화하세요. Teams 및 Enterprise의 경우, 관리자가 조직에 대해 추가 사용량을 활성화해야 합니다.
참고: 빠른 모드 사용량은 플랜에 남은 사용량이 있더라도 추가 사용량으로 직접 청구됩니다. 즉, 빠른 모드 토큰은 플랜에 포함된 사용량에 포함되지 않으며, 첫 번째 토큰부터 빠른 모드 요금으로 청구됩니다.
- Teams 및 Enterprise 관리자 활성화: 빠른 모드는 Teams 및 Enterprise 조직에서 기본적으로 비활성화되어 있습니다. 사용자가 접근하려면 관리자가 명시적으로 빠른 모드를 활성화해야 합니다.
참고: 관리자가 조직에 대해 빠른 모드를 활성화하지 않은 경우,
/fast명령은 "Fast mode has been disabled by your organization."을 표시합니다.
조직에 대한 빠른 모드 활성화
관리자는 다음에서 빠른 모드를 활성화할 수 있습니다:
- Console (API 고객): Claude Code preferences
- Claude AI (Teams 및 Enterprise): Admin Settings > Claude Code
빠른 모드를 완전히 비활성화하는 또 다른 방법은 CLAUDE_CODE_DISABLE_FAST_MODE=1을 설정하는 것입니다. 환경 변수를 참조하세요.
세션별 옵트인 요구
기본적으로 빠른 모드는 세션 간에 유지됩니다: 사용자가 빠른 모드를 활성화하면 이후 세션에서도 켜져 있습니다. Teams 또는 Enterprise 플랜의 관리자는 관리 설정 또는 서버 관리 설정에서 fastModePerSessionOptIn을 true로 설정하여 이를 방지할 수 있습니다. 이렇게 하면 각 세션이 빠른 모드가 꺼진 상태로 시작되어, 사용자가 /fast로 명시적으로 활성화해야 합니다.
{
"fastModePerSessionOptIn": true
}
이는 사용자가 여러 동시 세션을 실행하는 조직에서 비용을 제어하는 데 유용합니다. 사용자는 속도가 필요할 때 여전히 /fast로 빠른 모드를 활성화할 수 있지만, 새 세션이 시작될 때마다 초기화됩니다. 사용자의 빠른 모드 선호 설정은 저장되므로, 이 설정을 제거하면 기본 유지 동작이 복원됩니다.
속도 제한 처리
빠른 모드는 표준 Opus 4.6과 별도의 속도 제한을 가집니다. 빠른 모드 속도 제한에 도달하거나 추가 사용량 크레딧이 소진되면:
- 빠른 모드가 자동으로 표준 Opus 4.6로 폴백합니다
↯아이콘이 회색으로 변하여 쿨다운 상태를 나타냅니다- 표준 속도와 가격으로 계속 작업할 수 있습니다
- 쿨다운이 만료되면 빠른 모드가 자동으로 다시 활성화됩니다
쿨다운을 기다리는 대신 빠른 모드를 수동으로 비활성화하려면 /fast를 다시 실행하세요.
리서치 프리뷰
빠른 모드는 리서치 프리뷰 기능입니다. 이는 다음을 의미합니다:
- 피드백에 따라 기능이 변경될 수 있습니다
- 제공 여부와 가격은 변경될 수 있습니다
- 기반 API 구성이 발전할 수 있습니다
일반적인 Anthropic 지원 채널을 통해 문제나 피드백을 보고해 주세요.
참고 항목
- 모델 구성: 모델 전환 및 노력 수준 조정
- 비용 효과적으로 관리: 토큰 사용량 추적 및 비용 절감
- 상태 표시줄 구성: 모델 및 컨텍스트 정보 표시