コンテンツにスキップ
Zenn Harness Token Optimization

モデル切り替えから effort 切り替えへ — Opus 4.8 で AI ハーネスのトークン最適化実験

要約

AI エージェント・ハーネスを運用する筆者が、従来の「ジョブごとに Sonnet/Opus を使い分け」から「Opus 4.8 固定 + effort 切り替え」へ移行する実験ログ。1,000セッションのログ分析から、ジョブ別の修正ループ数(初回成功率)を計測し、高頻度ジョブ(discover, run-all)がトークン消費の大半を占めることを確認。ジョブ種別と修正ループ数の相関を実測した上で、effort を調整して修正ループを削減する仮説を立て移行中。ただし effort を下げた際に修正ループが増えるリスクの検証はまだ不十分。