コンテンツにスキップ
Devio Claude Fable5 Guardrail

Claude Code で Fable 5 が会話の途中で Opus 4.8 へ切り替わる挙動を再現してみる

  • URL: https://dev.classmethod.jp/articles/claude-fable-5-guardrail/
  • 日付: 2026-06-10
  • Tier: Tier 2
  • 要旨: Claude Fable 5はサイバーセキュリティ・生物/化学・蒸留攻撃に該当するリクエストを内蔵分類器が検知すると、会話途中でOpus 4.8に自動切り替えする(平均5%未満)。切り替えはWeb/デスクトップ設定で制御でき、Claude Codeにも同期される。

詳細

Fable 5の位置づけ:「Mythos級」と呼ぶ基盤モデルを一般利用向けに安全化したもの。セーフガードを外したClaude Mythos 5は審査済みのサイバーセキュリティ・生物研究者向けのみ提供。Fable(fabula=語られるもの)とMythos(同根)で名前を分けてセーフガードの有無を区別。

自動切り替えの仕組み:

  • 内蔵分類器がフラグするとOpus 4.8に処理を引き渡し(同じ会話内)
  • 全セッションの5%未満で発生
  • Claude Code含む全製品でデフォルト有効

設定方法:

  • ~/.claude/settings.jsonswitchModelsOnFlag効かない
  • Web/デスクトップアプリ側の「自動モデル切替」設定が有効でClaude Codeにも同期
  • オフ時:自動切替の代わりに「Opus 4.8に切り替えるか、プロンプトを修正してFable 5で再試行するか」の選択画面が表示

防御的なSSRF質問でも分類器が反応することがあり「安全な内容もフラグしうる」と公式が認めている。