Classmethod Gemini Enterprise Agent Platform Claude Code Monitoring

Gemini Enterprise Agent Platform での Claude Code 利用状況を Google Cloud ネイティブの機能で可視化・監視する

URL: https://dev.classmethod.jp/articles/gemini-enterprise-agent-platform-claude-code-monitoring/
日付: 2026-06-02
Tier: Tier 3
要旨: Claude CodeをVertex AI（Gemini Enterprise Agent Platform）バックエンドで使う際のモニタリング手法を解説。Model Observabilityダッシュボード・Logs Explorer・Cloud Monitoringアラートの3手段でQPS・レイテンシ・エラー率・誰が呼んだか等を可視化する実践ガイド。

詳細

設定: 環境変数 CLAUDE_CODE_USE_VERTEX=1 でClaude CodeがVertex AI経由でClaudeを呼び出す。streamRawPredict API中心。

モニタリング3手段:

Model Observability ダッシュボード（Cloud Monitoring プリビルド）
- QPS、トークンスループット、First token latency、APIエラー率
- model_user_id フィルターで claude-haiku-4-5 / claude-sonnet-4-6 / claude-opus-4-8 を個別確認
- 実計測: claude-opus-4-8 の p50 invocation latency が最大約1.5分（コーディング・推論タスク）
Logs Explorer（Data Access Audit Logs）
- aiplatform.googleapis.com への呼び出しを principalEmail 単位で追跡可能
- 個人ADC/個人SAで認証しないと個人単位追跡不可（共有SAだと誰か不明）
- 事前にData Access Audit Logsの有効化が必要（デフォルト無効）
Cloud Monitoring アラートポリシー
- エラー率急増を自動検知して通知

プロンプトキャッシュの確認: Token throughput の cache_read_input（青）が突出して大きく、Claude Codeのキャッシュ積極活用が数値で確認できた。

運用Tips: Provisioned Throughput未購入環境でクォータ超過（429）が頻発するようなら購入を検討。