Zenn Harness Token Optimization
モデル切り替えから effort 切り替えへ — Opus 4.8 で AI ハーネスのトークン最適化実験
- URL: https://zenn.dev/pepabo/articles/harness-token-optimization
- 日付: 2026-06-01
- 出典Tier: Tier 3(GMO Pepabo エンジニアブログ、実験ログ)
要約
AI エージェント・ハーネスを運用する筆者が、従来の「ジョブごとに Sonnet/Opus を使い分け」から「Opus 4.8 固定 + effort 切り替え」へ移行する実験ログ。1,000セッションのログ分析から、ジョブ別の修正ループ数(初回成功率)を計測し、高頻度ジョブ(discover, run-all)がトークン消費の大半を占めることを確認。ジョブ種別と修正ループ数の相関を実測した上で、effort を調整して修正ループを削減する仮説を立て移行中。ただし effort を下げた際に修正ループが増えるリスクの検証はまだ不十分。