コンテンツにスキップ
Classmethod Amazon Opensearch Serverless Nextgen

次世代Amazon OpenSearch ServerlessがGA開始、待機コストゼロになったのでベクトル検索を試してみた

要約

次世代(NextGen)Amazon OpenSearch ServerlessがGA。AIエージェントワークロードを念頭にアーキテクチャを刷新。

主な変更点(Classic→NextGen)

  • scale-to-zero: 最小OCU要件が2 OCUから0 OCUへ。10分間アイドルでゼロ縮退、約10秒で復帰
  • ストレージ分離: ローカルストレージ→分散共有ストレージ。コンピュートとストレージを独立スケール
  • オートスケーリング: 前世代比最大20倍高速
  • Collection Group: 複数コレクションでOCUを共有する管理単位を導入
  • GPU加速: VECTORSEARCH向けHNSWインデックス構築をAWS管理GPUでオフロード(最大10倍高速、インデックスコスト約1/4)
  • リソースベースエンドポイント: アカウント単位のエンドポイントが追加(1接続で複数コレクション)
  • 対応コレクションタイプ: SEARCH・VECTORSEARCH(TIMESERIES は現時点非対応)

エコシステム連携: Vercel(AWS Marketplace経由)、Kiro(OpenSearch Launchpad)、OpenSearch Agent Skills(Claude Code・Cursor・Codexから利用可能)

料金: scale-to-zeroにより待機コストゼロ。アイドル後10分間は課金対象(例:検索1回で約$0.11)

CLI注意点: AWS CLI v2.34.57以上が必要(v2.34.42では--generation NEXTGENオプション未対応)