Tech Layerx Co Jp Ai Agent Long Term Memory Simulation

AIエージェントに1年分のニュースを読ませて4,500件の長期記憶を作って見えた課題

URL: https://tech.layerx.co.jp/entry/ai-agent-long-term-memory-simulation
日付: 2026-06-03
Tier: Tier 3
要旨: LayerX AI Workforce 事業部が、Claude Code の Memory 機構を参考に構築した長期記憶システムで 1 年分の AI ニュース（60 号分）を処理し、4,552 件の記憶ファイルを生成。実スケールで動かして初めて見えた課題（コンテキスト枯渇・グラフ未成長・フォーマット崩れ）を詳細にレポート。

詳細

実験規模: 最大 6 並列・約 20 時間・607 セッション・4,552 メモリファイル生成
コスト: Claude Code Max プラン、API 換算で約 $407
モデル: Claude Sonnet 4.6（200k コンテキスト）
システム構成（Claude Code Memory を参考）:
- frontmatter 付き Markdown ファイル 1 つが 1 記憶単位
- qmem-add Skill: 記憶の追加
- qmem-search Skill: BM25＋ベクトル検索、ファイル名/description カタログ (qmem-ls)、グラフ辿り、grep
- Hook によるリマインダー: ユーザー prompt と tool 結果をクエリに BM25 検索し、閾値超えで <qmem> 注入
- Dreaming (qmem-maintain) Skill: 20 セッションに 1 回、重複削除・古い記憶更新・related 更新
Dreaming 結果: 18 回実行、450 件更新・245 件削除（主に重複削除）
発見された課題:
1. コンテキスト枯渇: 4,552 ファイルのカタログだけで 200k コンテキストの 228% を占有。Dreaming 自体がスケールしない
2. グラフ未成長: related フィールドを持つファイルがわずか 11.3%。関連があるのに紐づいていないケースを多数確認。プロンプトの積極性不足
3. フォーマット崩れ: ファイル名のみ指定するところにパスを記述、日付を月までしか書かない等。Dreaming が修正するが、LLM 依存ではなくハーネス側でバリデーションが必要
教訓: 記憶設計よりプロンプトの細部（いつ繋ぐか・何を記憶するか）の影響が大きい。「忘れさせる戦略」vs「スケールさせる戦略」の 2 軸で設計を決める必要がある

Say Tech Co Jp Yamanxworld 2026vol207 Tech Layerx Co Jp Invoice Automation Simulator