コンテンツにスキップ
Zenn Dev Prg Yukke Articles 4ed130585846c3

使用コストも出せるE2Eを作ったら、Codexに予算を渡して改善ループを回してもらえるようになった話

  • URL: https://zenn.dev/prg_yukke/articles/4ed130585846c3
  • 日付: 2026-06-23
  • Tier: Tier 3
  • 要旨: 実通話 E2E に費目別コスト台帳と予算上限を持たせることで、Codex に「品質を保ったまま予算内で改善」を委譲。1 通話あたり 25.9% コスト削減(音声生成モデル 30.9% 削減)を実現。

詳細

電話 AI「スパ電」のコスト改善。従来の E2E は pass/fail のみだが、費目別 cost ledger(音声生成・通話基盤・録音・ストリーム・補助処理に分類)と予算上限を追加。60 件ベンチマークで音声生成モデル 47%(受電 72.6%)が支配的と判明。cost ledger 導出後、Codex への依頼が「通して」から「予算 10ドル内で品質保ったまま改善」に変化。Codex は改善案 → 実装 → E2E 実行 → cost 計測 → 判定(採用/破棄)のループを自律実行。採用 9 件・見送り 7 件で 1 通話あたり -25.9%(音声生成 -30.9%)削減。品質ゲートと予算上限が同じループに乗ると、試行暴走防止と「安いが品質低下」の案が自動排除。E2E 戻り値設計がエージェントの目的関数そのもの。