コンテンツにスキップ
Classmethod Gemini Enterprise Agent Platform Claude Code Monitoring

Gemini Enterprise Agent Platform での Claude Code 利用状況を Google Cloud ネイティブの機能で可視化・監視する

  • URL: https://dev.classmethod.jp/articles/gemini-enterprise-agent-platform-claude-code-monitoring/
  • 日付: 2026-06-02
  • Tier: Tier 3
  • 要旨: Claude CodeをVertex AI(Gemini Enterprise Agent Platform)バックエンドで使う際のモニタリング手法を解説。Model Observabilityダッシュボード・Logs Explorer・Cloud Monitoringアラートの3手段でQPS・レイテンシ・エラー率・誰が呼んだか等を可視化する実践ガイド。

詳細

設定: 環境変数 CLAUDE_CODE_USE_VERTEX=1 でClaude CodeがVertex AI経由でClaudeを呼び出す。streamRawPredict API中心。

モニタリング3手段:

  1. Model Observability ダッシュボード(Cloud Monitoring プリビルド)

    • QPS、トークンスループット、First token latency、APIエラー率
    • model_user_id フィルターで claude-haiku-4-5 / claude-sonnet-4-6 / claude-opus-4-8 を個別確認
    • 実計測: claude-opus-4-8 の p50 invocation latency が最大約1.5分(コーディング・推論タスク)
  2. Logs Explorer(Data Access Audit Logs)

    • aiplatform.googleapis.com への呼び出しを principalEmail 単位で追跡可能
    • 個人ADC/個人SAで認証しないと個人単位追跡不可(共有SAだと誰か不明)
    • 事前にData Access Audit Logsの有効化が必要(デフォルト無効)
  3. Cloud Monitoring アラートポリシー

    • エラー率急増を自動検知して通知

プロンプトキャッシュの確認: Token throughput の cache_read_input(青)が突出して大きく、Claude Codeのキャッシュ積極活用が数値で確認できた。

運用Tips: Provisioned Throughput未購入環境でクォータ超過(429)が頻発するようなら購入を検討。