Classmethod Pubsub Ai Inference Smt

Pub/SubのAI Inference SMTでメッセージにVertex AI推論を組み込んでみる

URL: https://dev.classmethod.jp/articles/google-pubsub-ai_inference_smt/
日付: 2026-05-31
トピック: programming, cloud, ai-llm
出典Tier: Tier 3（classmethod / 一次体験・実装を含む技術ブログ）

要約

2026年4月6日にGAとなったPub/Sub AI Inference SMT（Single Message Transform）の実装・検証記事。仲介サービス（Cloud Functions等）不要でPub/Sub内でVertex AI推論を実行できる機能。

主な特徴：

対応モデル：Vertex AIデプロイ済みモデル・Model Garden（Gemini、Claude、Llama等50以上）
トピックレベルとサブスクリプションレベルの両方に設定可能
1トピック/サブスクリプションにつき最大5 SMT（実行順は定義順）
推論タイムアウト：60秒、バッチ処理は非対応（1メッセージにつき1推論リクエスト）
プライベートエンドポイント非対応（パブリックエンドポイントのみ）
AI Inference SMTは1トピック/サブスクリプションにつき1つまで

変換の仕組み：元のメッセージが original_message に保持され、推論結果が model_output として付加される

注意点：

エンドポイントのlocationsは global を指定推奨（リージョン指定だと処理リージョン不一致でエラー）
--ack-deadline=600（10分）を推奨（推論タイムアウト60秒＋サブスクライバー処理時間）
IAM権限：Pub/SubサービスエージェントにVertex AI Userロールが必要
テスト時もVertex AIが呼ばれるため実費発生

Classmethod Kiro CLI 2 5 Classmethod Security Hub Unused Access