コンテンツにスキップ
Dev Classmethod Jp Articles Bedrock Managed Kb Multimodal Rag

Amazon Bedrock Managed Knowledge Base で画像・音声・動画のマルチモーダル RAG を構築してみた

  • URL: https://dev.classmethod.jp/articles/bedrock-managed-kb-multimodal-rag
  • 日付: 2026-06-24
  • Tier: Tier 2
  • 要旨: Amazon Bedrock Managed Knowledge Base(2026年6月17日 GA)は、RAG構築におけるインフラ管理・ベクトルストア運用をAWSに任せられるサービスである。スマートパーシングとマルチモーダル対応により、PDF・PowerPoint・Word・画像・音声・動画など複数形式に自動対応し、ファイル形式に応じて最適な解析手法が適用される。Amazon S3をはじめ Microsoft SharePoint、Confluence、Google Drive、Microsoft OnDriveなどのコネクタが標準で用意されている。

詳細

マネージドナレッジベース構築の流れは4つのステップである。1) ナレッジベース作成:Bedrock コンソールから Create Managed KB を選択し、ナレッジベース名を入力。追加設定では説明・埋め込みモデル・IAMロール・ベクトルストア暗号化を設定。データソースを選択してから Advanced configurations でマルチモーダル対応を有効化。2) データソース追加:Visual content in documents(PDF・docx・ppt・pptxの画像)、Audio files(.mp3・.wav・.m4a・.flac・.ogg)、Video files(.mp4・.mov・.m4v)にチェック。Max file size はVideo files チェック時に最大10240 MB まで設定可能。Document deletion safeguard は誤削除防止。3) データ同期:作成完了後、S3 バケットに画像付きパワーポイント・日本語読み上げ音声・動画素材などをアップロードしてデータソース同期を実行。4) テスト:コンソール上からナレッジベースをテスト。埋め込み画像や音声、スライドなどを Amazon Bedrock に関する質問で検索でき、正常に参照される。動画についても Agentic retrieval with answer generation を利用して海辺の映像などが詳細に認識される。注意点として、対応リージョンは現在8リージョン(us-east-1・us-west-2・eu-west-1・eu-west-2・eu-central-1・ap-northeast-1・ap-southeast-2・us-gov-west-1)に限定。埋め込みモデルの選択は float32・1024次元のモデルに限定される。データソース容量は KB あたり データソース数200・生データストレージ10 TB・同時インジェスション50。マルチモーダル対応ではデータサイズが大きくなりやすいため、クォータ引き上げの検討が必要な場合がある。