コンテンツにスキップ
Dev Classmethod Jp Articles Bedrock Application Inference Cloudwatch

Amazon Bedrock の Application Inference Profiles で CloudWatch メトリクスがプロファイル単位に分かれるか検証してみた

  • URL: https://dev.classmethod.jp/articles/bedrock-application-inference-cloudwatch
  • 日付: 2026-06-20
  • Tier: Tier 2
  • 要旨: Bedrock Application Inference ProfilesをCloudWatchと組み合わせてコスト配賦と利用状況モニタリングを実現する構成を検証した記事。プロファイルごとにCloudWatchディメンションが分かれるため、チーム別・アプリケーション別の可視化が可能になる。

詳細

Application Inference ProfilesはBedrockの呼び出しにタグを付ける仕組みで、同じモデルを複数プロファイルで呼び分けると、CloudWatchのBedrockメトリクスがapplicationNameディメンション付きで分離して記録される。InputTokenCount・OutputTokenCount・InvocationLatency等をプロファイル別にグラフ化でき、コスト配賦のためのタグ付けにも活用できる。クロスリージョンプロファイルではリージョン間のレイテンシも確認されている。