コンテンツにスキップ
Zenn Dev Yushiyamamoto Articles Claude Agent Approval Gate Design 2026 06

AIエージェントの承認ゲート設計:下書きまでと本番実行の境界を実装する

  • URL: https://zenn.dev/yushiyamamoto/articles/claude-agent-approval-gate-design-2026-06
  • 日付: 2026-06-21
  • Tier: Tier 3
  • 要旨: AIエージェント自動化で発生する下書き→本番実行の誤動作を防ぐため、操作を3つのクラスに分類し、外部送信・公開操作は明示的な承認ゲートでブロック。RequiresApproval フィールドで承認待ちを可視化し、コントローラ層で承認フラグ管理。

詳細

エージェント出力に requiresApproval フィールドを含め、人間確認が必要な操作(メール送信、SNS 投稿、DB 更新)をエージェント自体では実行せず、返り値に積むだけにして、コントローラが明示的に承認フラグを埋める2段階構成。読み取り専用・ローカル書き込み・外部送信の3つのクラスに全ツールを分類し、外部送信系ツールはエージェントに初めから渡さない防御線を設置。dry_run フラグだけでは不十分なため、承認がなければ外部送信ツール自体が利用不可能な設計を採用。下書きは必ず承認前にローカル保存してパスを返し、承認後に読み込んで実行するため、承認と実行内容のずれを排除。自動承認リストはデフォルトで空配列で、夜間自動実行時は承認なし、人間レビュー時のみ autoApprove に操作 ID を指定。実装チェックリストとテストケース(承認なしで外部送信が走らないこと)を明記。