Codex Record & Replay の正体は「再生」ではない:従量課金が変えるエージェント設計、3つの勘所
- URL: https://zenn.dev/hironakamura_ai/articles/18cb891c726984
- 日付: 2026-06-22
- Tier: Tier 3
- 要旨: Codex Record & Replay の正体は「再生」でなく「実演→スキル化→再実行+検証」。従量課金が「最適化の狙い」を変えた。推論の償却(amortize cognition):定額課金時代は「毎回どれだけ深く考えるか」が賢さ、長く考えるほど偉い。従量課金は逆、繰り返しタスクで毎回プラン立て直しは二重払い。初回思考を成果物に固めて使い回す方向。インタプリタからコンパイラへの移動に近い。トレース→パラメータ付き仕様→本番:座標再生でなく現環境で再グラウンディング+検証ゲート。3つの勘所:トレース捨てない・スキル化・機械的判定可能な検証。
詳細
Codex の Record & Replay は「録画再生」でなく「教師例→スキル下書き→本番再実行」。OpenAI ドキュメント:録画止めると Codex が「キャプチャしたワークフロー点検・スキル下書き。スキルに『いつ使う・入力要件・手順・結果検証』」と述べ、保存されるのは操作テープでなく言語化した仕様書。再生時は新スレッド・今回だけ違う値(ファイル・issue・日付範囲)渡す。Codex がコンテキストとして読み、Computer Use・ブラウザで「その場のツール」使い、毎回その場の画面に向き合ってボタン選び直して動く。座標を叩き直すでなく「パラメータ付き仕様」と現環境で再グラウンディング。従量課金が「最適化の狙い」を変えた、Copilot トークン効率記事「従量課金にいま、エージェントセッションの1トークンすべてが効く」。プロンプトキャッシュ保持延長・安定境界に最大4つキャッシュ区切り・ツール定義名と説明だけの軽いメタ必要時展開で 9~18% トークン削減。「同じ文脈毎ターン読み直して課金される」をやめ「一度やった思考を再利用・二度払わない」。推論の償却(amortize cognition):定額課金は「毎回深く考えるか」で賢さ・長く考えるほど偉い、従量課金は逆・繰り返しで毎回プラン立て直しは二重払い、初回思考を成果物に固めて使い回す。インタプリタからコンパイラへの移動。意図毎回その場で解釈でなく、再利用可能な中間表現に一度コンパイル。Record & Replay のスキルもCopilot キャッシュ済みプレフィックスも「コンパイル済みの何か」。自分のエージェント3つ:トレース捨てない・パラメータ付き仕様を起こす・機械的に判定可能な検証必ず付ける。非決定的再実行を信用できるものに変えるのは最後の検証ゲート。決定的な骨格・非決定的な穴埋め・決定的な検証で三層。