コンテンツにスキップ
Dev Classmethod Jp Bedrock Openai Gpt55 Streaming

BedrockのOpenAIモデル(GPT-5.5 / GPT-5.4)がus-east-1で利用可能になったので試してみた

詳細

リージョン拡大の意義: 日本向けワークロードでは「東京・大阪・バージニアのみ許可」のSCPが多く、オハイオのみ対応だったGPT-5.5/5.4はSCP制約下では使えなかった。us-east-1対応でこの問題が解消。

実測値(reasoning.effort=“low"使用):

モデルTTFT総レイテンシInput/Output tokens
GPT-5.51.35s22.30s35 / 132
GPT-5.40.95s33.70s34 / 122

重要な制約

  • Chat Completions API(/v1/chat/completions)は非対応。Responses APIのみ
  • 総レイテンシは22〜34秒と長いが、TTFTは1秒前後と速く、ストリーミング提示としては許容範囲

ストリーミングイベント順序response.createdresponse.in_progressresponse.output_text.delta(N回)→ response.completed