Zenn Harness Token Optimization

モデル切り替えから effort 切り替えへ — Opus 4.8 で AI ハーネスのトークン最適化実験

URL: https://zenn.dev/pepabo/articles/harness-token-optimization
日付: 2026-06-01
出典Tier: Tier 3（GMO Pepabo エンジニアブログ、実験ログ）

要約

AI エージェント・ハーネスを運用する筆者が、従来の「ジョブごとに Sonnet/Opus を使い分け」から「Opus 4.8 固定 + effort 切り替え」へ移行する実験ログ。1,000セッションのログ分析から、ジョブ別の修正ループ数（初回成功率）を計測し、高頻度ジョブ（discover, run-all）がトークン消費の大半を占めることを確認。ジョブ種別と修正ループ数の相関を実測した上で、effort を調整して修正ループを削減する仮説を立て移行中。ただし effort を下げた際に修正ループが増えるリスクの検証はまだ不十分。

Publickey Rolldown 10 Vite 80 Zenn Mysh Winget Windows