コンテンツにスキップ
Dev Classmethod Jp Articles Google Chat Bot Vertex Ai Rag Engine

Google Chat Bot に Vertex AI RAG Engine を繋いでナレッジベース検索を実装した話

  • URL: https://dev.classmethod.jp/articles/google-chat-bot-vertex-ai-rag-engine
  • 日付: 2026-06-20
  • Tier: Tier 2
  • 要旨: Google Chat BotにVertex AI RAG Engineを組み込んで社内文書検索を実装した際に、日本語検索精度が低下するハマりポイントを報告した記事。text-embedding-005の非対称タスクタイプ設定ミスが原因で、text-multilingual-embedding-002への変更で解消した。

詳細

Vertex AI RAG EngineのEmbeddingモデルとしてtext-embedding-005を使用したところ、日本語クエリに対する検索精度が著しく低かった。原因はtext-embedding-005のtask_type設定で、クエリ側に’RETRIEVAL_QUERY’・文書側に’RETRIEVAL_DOCUMENT’を非対称に設定する必要があるが、どちらも同じtask_typeにしていたため内積計算がずれていた。text-multilingual-embedding-002はtask_typeを設定しなくてもデフォルトで多言語対称埋め込みになるため、日本語検索精度が改善した。RAGのChunk設定(chunk_size=500・overlap=100)も精度改善に効果があった。