Classmethod Pubsub Ai Inference Smt
Pub/SubのAI Inference SMTでメッセージにVertex AI推論を組み込んでみる
- URL: https://dev.classmethod.jp/articles/google-pubsub-ai_inference_smt/
- 日付: 2026-05-31
- トピック: programming, cloud, ai-llm
- 出典Tier: Tier 3(classmethod / 一次体験・実装を含む技術ブログ)
要約
2026年4月6日にGAとなったPub/Sub AI Inference SMT(Single Message Transform)の実装・検証記事。仲介サービス(Cloud Functions等)不要でPub/Sub内でVertex AI推論を実行できる機能。
主な特徴:
- 対応モデル:Vertex AIデプロイ済みモデル・Model Garden(Gemini、Claude、Llama等50以上)
- トピックレベルとサブスクリプションレベルの両方に設定可能
- 1トピック/サブスクリプションにつき最大5 SMT(実行順は定義順)
- 推論タイムアウト:60秒、バッチ処理は非対応(1メッセージにつき1推論リクエスト)
- プライベートエンドポイント非対応(パブリックエンドポイントのみ)
- AI Inference SMTは1トピック/サブスクリプションにつき1つまで
変換の仕組み:元のメッセージが original_message に保持され、推論結果が model_output として付加される
注意点:
- エンドポイントのlocationsは
globalを指定推奨(リージョン指定だと処理リージョン不一致でエラー) --ack-deadline=600(10分)を推奨(推論タイムアウト60秒+サブスクライバー処理時間)- IAM権限:Pub/SubサービスエージェントにVertex AI Userロールが必要
- テスト時もVertex AIが呼ばれるため実費発生