Zenn Fable5 vs Opus48 Qcd
Claude Fable 5 の実力は本当に最強なのか——Opus 4.8 と QCD で比較する(オトナの自由研究 #24)
- URL: https://zenn.dev/nnakapa/articles/lab-24-fable5-opus48-qcd
- 日付: 2026-06-10
- Tier: Tier 3
- 要旨: Fable 5とOpus 4.8を品質(Q)・コスト(C)・処理時間(D)の3軸で240試行(8パターン×30試行)比較。RDB実装タスクでは「Fable 5 mediumでも細部を取りこぼす」「Opus 4.8 mediumが同等以上の品質をより低コストで達成」という結果に。
詳細
検証設計:
- Claude Code v2.1.170固定、Fable 5 vs Opus 4.8を各4 effort level(low/medium/high/xhigh)で比較
- タスク:PostgreSQL+psycopg2を使った小Pythonモジュール3つを実装(スケルトン→仕様書から実装)
- 採点:ISO 25010由来の5軸加重(Functional 0.40/Reliability 0.20/Security 0.15/Maintainability 0.15/Safety 0.10)で全自動採点
仕込んだ罠(隠しテスト):
- T1(送金):失敗経路のロールバック漏れ・idle-in-transaction
- T2(検索):LIKEメタ文字エスケープ・空IN句・識別子インジェクション
- T3(在庫):version不一致でのlost update・rowcount未確認
結論:
- Fable 5はmediumでも細部(エッジケース・セキュリティ)を取りこぼすことがある
- Opus 4.8 mediumは今回の条件ではFable 5より低effort・低コストで同等以上の品質
- 「Fable 5は常に最強」ではなく、タスクの性質・effort levelのチューニングが重要
「効果的なコンテキスト圧縮と仕込んだ罠の質で評価が変わる」という実証的アプローチが参考になる。