コンテンツにスキップ
Classmethod Pubsub Ai Inference Smt

Pub/SubのAI Inference SMTでメッセージにVertex AI推論を組み込んでみる

要約

2026年4月6日にGAとなったPub/Sub AI Inference SMT(Single Message Transform)の実装・検証記事。仲介サービス(Cloud Functions等)不要でPub/Sub内でVertex AI推論を実行できる機能。

主な特徴

  • 対応モデル:Vertex AIデプロイ済みモデル・Model Garden(Gemini、Claude、Llama等50以上)
  • トピックレベルとサブスクリプションレベルの両方に設定可能
  • 1トピック/サブスクリプションにつき最大5 SMT(実行順は定義順)
  • 推論タイムアウト:60秒、バッチ処理は非対応(1メッセージにつき1推論リクエスト)
  • プライベートエンドポイント非対応(パブリックエンドポイントのみ)
  • AI Inference SMTは1トピック/サブスクリプションにつき1つまで

変換の仕組み:元のメッセージが original_message に保持され、推論結果が model_output として付加される

注意点

  • エンドポイントのlocationsは global を指定推奨(リージョン指定だと処理リージョン不一致でエラー)
  • --ack-deadline=600(10分)を推奨(推論タイムアウト60秒+サブスクライバー処理時間)
  • IAM権限:Pub/SubサービスエージェントにVertex AI Userロールが必要
  • テスト時もVertex AIが呼ばれるため実費発生