Dev Classmethod Jp Articles 20260622 Glue Data Catalog Business Context
[アップデート] AWS Glue Data Catalog がビジネスコンテキストとセマンティック検索をサポートしたので試してみました(プレビュー)
- URL: https://dev.classmethod.jp/articles/20260622-glue-data-catalog-business-context
- 日付: 2026-06-23
- Tier: Tier 2
- 要旨: AWS Glue Data Catalog にビジネスコンテキスト・セマンティック検索機能追加(プレビュー)。用語集(glossary)で「アクティブユーザー」等業務概念に標準定義。アセットへの関連付けでテーブルが「何を表すデータか」表現。セマンティック検索(search-assets) API でテーブル名でなく業務コンテキスト意味から検索。カスタムメタデータ・スキルアセットで利用ルール・結合パス追加文脈。AI エージェント(MCP/Agent Toolkit)利用も想定。対応リージョン:米国東部2・西部・欧州アイルランド。
詳細
Glue Data Catalog 従来は テーブル名・カラム名等テクニカルメタデータ中心。今回アップデートで業務コンテキスト付与可能。背景:AI エージェント が信頼できる定義に基づいて推論できるようデータに業務コンテキスト必要。
3 つのコア要素。①用語集(glossary)・用語(glossary term):「アクティブユーザー」業務概念に標準定義。②アセット関連付け:用語をテーブル紐付けで「何を表すデータか」表現。③セマンティック検索(search-assets API):テーブル名でなく業務コンテキスト・説明文の意味から検索。
追加機能:カスタムメタデータ(form type)・スキルアセット で利用ルール・結合パスといった文脈付加。MCP 対応エージェント・AWS Agent Toolkit 利用想定。記事検証は glossary→関連付け→セマンティック検索。
前提:Data Catalog テーブル登録済み・glue:CreateGlossary/CreateGlossaryTerm/AssociateGlossaryTerms/Search/GetAsset 権限・検証リージョン us-east-1。マネジメントコンソール UI 実装なし(プレビュー)、aws CLI コマンド利用。検証:S3 bucket→glue database→table(sales_transactions 等)作成→glossary term 定義→search-assets で意味ベース検索実行。