Tech Layerx Co Jp Ai Agent Long Term Memory Simulation
AIエージェントに1年分のニュースを読ませて4,500件の長期記憶を作って見えた課題
- URL: https://tech.layerx.co.jp/entry/ai-agent-long-term-memory-simulation
- 日付: 2026-06-03
- Tier: Tier 3
- 要旨: LayerX AI Workforce 事業部が、Claude Code の Memory 機構を参考に構築した長期記憶システムで 1 年分の AI ニュース(60 号分)を処理し、4,552 件の記憶ファイルを生成。実スケールで動かして初めて見えた課題(コンテキスト枯渇・グラフ未成長・フォーマット崩れ)を詳細にレポート。
詳細
- 実験規模: 最大 6 並列・約 20 時間・607 セッション・4,552 メモリファイル生成
- コスト: Claude Code Max プラン、API 換算で約 $407
- モデル: Claude Sonnet 4.6(200k コンテキスト)
- システム構成(Claude Code Memory を参考):
- frontmatter 付き Markdown ファイル 1 つが 1 記憶単位
qmem-addSkill: 記憶の追加qmem-searchSkill: BM25+ベクトル検索、ファイル名/description カタログ (qmem-ls)、グラフ辿り、grep- Hook によるリマインダー: ユーザー prompt と tool 結果をクエリに BM25 検索し、閾値超えで
<qmem>注入 - Dreaming (
qmem-maintain) Skill: 20 セッションに 1 回、重複削除・古い記憶更新・related 更新
- Dreaming 結果: 18 回実行、450 件更新・245 件削除(主に重複削除)
- 発見された課題:
- コンテキスト枯渇: 4,552 ファイルのカタログだけで 200k コンテキストの 228% を占有。Dreaming 自体がスケールしない
- グラフ未成長:
relatedフィールドを持つファイルがわずか 11.3%。関連があるのに紐づいていないケースを多数確認。プロンプトの積極性不足 - フォーマット崩れ: ファイル名のみ指定するところにパスを記述、日付を月までしか書かない等。Dreaming が修正するが、LLM 依存ではなくハーネス側でバリデーションが必要
- 教訓: 記憶設計よりプロンプトの細部(いつ繋ぐか・何を記憶するか)の影響が大きい。「忘れさせる戦略」vs「スケールさせる戦略」の 2 軸で設計を決める必要がある