Zenn Dev Acntechjp Articles F00b201cabcc39
Claude Codeのトークンコストを、仕組みから理解して削る
- URL: https://zenn.dev/acntechjp/articles/f00b201cabcc39
- 日付: 2026-06-25
- Tier: Tier 3
- 要旨: Claude Codeのトークンコストは仕組みを理解することで削減できる。キャッシュの3層構造(システムプロンプト→プロジェクトコンテキスト→会話)と、先頭部分の変化による全損リスクを把握することが鍵。出力トークンが入力の5倍高いため、LLMに長く喋らせない設計が最も効く。
詳細
Claude Codeのコスト構造は料金表(Opus入力$5/100万トークン、出力$25)だけでなく、キャッシュ機構(再利用時約1/10)の活用が実質的な節約に繋がる。プロンプトキャッシュは毎ターン「変わらずに続いている共通部分」を前回と同じプレフィックスで比較判定するため、1バイト変わると後ろ全部が再計算される。システムプロンプト変更・モデル切り替え・effort変更・MCP増減など8つの操作がキャッシュを破壊し、その直後のターンは全文再処理される。TTL(キャッシュ有効期限)はサブスク1時間、APIキー5分。モデルの使い分けはchoko-choko切り替えで損なので節目でまとめ、難しい作業だけOpus、簡単な作業はHaikuに割り当てる。サブエージェントを安いモデルに指定することで、本体コンテキストを汚さず並列処理できる。