Zenn Dev Claude Code Token Reduction Measured
Claude Code のトークン削減を実測した — semble 93%・cacheRead 1800倍の内訳
- URL: https://zenn.dev/pepabo/articles/claude-code-token-reduction-measured
- 日付: 2026-06-08
- Tier: Tier 3
- 要旨: Claude Code の実トークン使用量を ccusage と semble で定量計測したレポート。cacheRead が入力の 1800 倍、コード検索削減率 93% という具体的な数字を公開。3 つの独自工夫(ルールの on-demand 化・rule-mining・効果計測)も紹介。
詳細
実測値(累計)
- cacheRead: 136 億トークン
- キャッシュによるコスト節約換算: 約 $10,168 相当(Max プランのため実際の追加支払いなし)
- 1 日の例: 入力 45 万トークンに対して cacheRead 8 億トークン(約 1800 倍)
semble(意味検索 MCP サーバー)効果
- 累計 331 回の検索で、grep/Read 総当たりと比較して 93% 削減
- semble なしの推定読み込み量: 830 万トークン → semble 経由: 50 万トークン
独自の 3 工夫
- ルールの on-demand 化: 状況依存のルールを
playbooks/に退避し、セッション開始時の固定コストを削減 - rule-mining: 日々のセッションログから繰り返しパターンを抽出してルールを継続改善
- 計測の仕組み: ccusage + semble 実ログで効果を定期測定することで「やった気」を防ぐ
定番手法との組み合わせ
- プロンプトキャッシング: 設定変更時はセッションを切り直してキャッシュ破棄を 1 回に集約
- モデルルーティング: インフラ設計レビュー → Opus、実装 → Sonnet
- サブエージェント分離: 探索・レビューをサブエージェントに切り出して要約のみ受け取る