Classmethod Gemini Enterprise Agent Platform Claude Code Monitoring
Gemini Enterprise Agent Platform での Claude Code 利用状況を Google Cloud ネイティブの機能で可視化・監視する
- URL: https://dev.classmethod.jp/articles/gemini-enterprise-agent-platform-claude-code-monitoring/
- 日付: 2026-06-02
- Tier: Tier 3
- 要旨: Claude CodeをVertex AI(Gemini Enterprise Agent Platform)バックエンドで使う際のモニタリング手法を解説。Model Observabilityダッシュボード・Logs Explorer・Cloud Monitoringアラートの3手段でQPS・レイテンシ・エラー率・誰が呼んだか等を可視化する実践ガイド。
詳細
設定: 環境変数 CLAUDE_CODE_USE_VERTEX=1 でClaude CodeがVertex AI経由でClaudeを呼び出す。streamRawPredict API中心。
モニタリング3手段:
Model Observability ダッシュボード(Cloud Monitoring プリビルド)
- QPS、トークンスループット、First token latency、APIエラー率
model_user_idフィルターで claude-haiku-4-5 / claude-sonnet-4-6 / claude-opus-4-8 を個別確認- 実計測: claude-opus-4-8 の p50 invocation latency が最大約1.5分(コーディング・推論タスク)
Logs Explorer(Data Access Audit Logs)
aiplatform.googleapis.comへの呼び出しをprincipalEmail単位で追跡可能- 個人ADC/個人SAで認証しないと個人単位追跡不可(共有SAだと誰か不明)
- 事前にData Access Audit Logsの有効化が必要(デフォルト無効)
Cloud Monitoring アラートポリシー
- エラー率急増を自動検知して通知
プロンプトキャッシュの確認: Token throughput の cache_read_input(青)が突出して大きく、Claude Codeのキャッシュ積極活用が数値で確認できた。
運用Tips: Provisioned Throughput未購入環境でクォータ超過(429)が頻発するようなら購入を検討。