コンテンツにスキップ
Zenn Dev Claude Code Token Reduction Measured

Claude Code のトークン削減を実測した — semble 93%・cacheRead 1800倍の内訳

  • URL: https://zenn.dev/pepabo/articles/claude-code-token-reduction-measured
  • 日付: 2026-06-08
  • Tier: Tier 3
  • 要旨: Claude Code の実トークン使用量を ccusage と semble で定量計測したレポート。cacheRead が入力の 1800 倍、コード検索削減率 93% という具体的な数字を公開。3 つの独自工夫(ルールの on-demand 化・rule-mining・効果計測)も紹介。

詳細

実測値(累計)

  • cacheRead: 136 億トークン
  • キャッシュによるコスト節約換算: 約 $10,168 相当(Max プランのため実際の追加支払いなし)
  • 1 日の例: 入力 45 万トークンに対して cacheRead 8 億トークン(約 1800 倍)

semble(意味検索 MCP サーバー)効果

  • 累計 331 回の検索で、grep/Read 総当たりと比較して 93% 削減
  • semble なしの推定読み込み量: 830 万トークン → semble 経由: 50 万トークン

独自の 3 工夫

  1. ルールの on-demand 化: 状況依存のルールを playbooks/ に退避し、セッション開始時の固定コストを削減
  2. rule-mining: 日々のセッションログから繰り返しパターンを抽出してルールを継続改善
  3. 計測の仕組み: ccusage + semble 実ログで効果を定期測定することで「やった気」を防ぐ

定番手法との組み合わせ

  • プロンプトキャッシング: 設定変更時はセッションを切り直してキャッシュ破棄を 1 回に集約
  • モデルルーティング: インフラ設計レビュー → Opus、実装 → Sonnet
  • サブエージェント分離: 探索・レビューをサブエージェントに切り出して要約のみ受け取る