コンテンツにスキップ
Zenn Dev Akasara Articles B6f09f71e2fb23

ChatGPTの回答、半分ウソかも?─ AIの嘘を見抜く「3ステップ検証」完全ガイド

  • URL: https://zenn.dev/akasara/articles/b6f09f71e2fb23
  • 日付: 2026-06-26
  • Tier: Tier 3
  • 要旨: AIハルシネーションの実被害事例(弁護士が架空判例を繰り返し提出しクライアントが自動敗訴した事案等)を起点に、3段階の検証フローを解説した記事。Phase 1は同じAIに回答者とチェック係を分けて確信度を分類させ、Phase 2は別モデルに批判役をさせることで同一モデルの盲点を補い、Phase 3は取り返しのつかない場面のみ一次情報の出典紐付けを行う。オープンドメインでのハルシネーション率はOpenAI o3のSimpleQAで51%、Grok-3のニュース出典特定で94%誤答という数値が示されており、モデルが賢くなるほど「創作」が上手くなる逆説的リスクも整理されている。

詳細

  • 被害事例: フェルドマン弁護士がAI架空引用を裁判所警告後も繰り返し→クライアントに自動敗訴判決(Reason, 2026年2月)。AI Hallucination Cases Databaseには905件超の法的事案が記録
  • ハルシネーション率データ(要約タスク・Vectara HHEM): Finix S1 32B 1.8%、Gemini 2.5 Flash Lite 3.3%、Microsoft Phi-4 3.7%
  • ハルシネーション率データ(オープンドメイン): OpenAI o3のPersonQA 33%、SimpleQA 51%、o4-miniのSimpleQA 79%、Grok-3のニュース出典特定 94%、ChatGPT総合 35%
  • なぜ賢いモデルほどリスクが高いか: 推論能力強化により存在しない論理や事実を「推論」で捏造する。OpenAI o3はSimpleQA正答率49.0%
  • Phase 1プロンプト設計: 「結論→理由→手順→注意点」で回答させた後、同じチャットで「確実/たぶん/不明」の3カテゴリに分類させる。数値・固有名詞・断定表現を重点チェック
  • Phase 2の必要性: 同じAIは同じ学習データ→同じ盲点。別モデルへ「性格の悪い批評家」として間違いの条件3つ・例外3つ・最も危ない断定・一般人が信じやすい誤りを指摘させる
  • Phase 3の適用場面: クライアント提出資料・契約書・法的文書・医療安全情報のみ。社内ブレスト等はPhase 2まで
  • 多数決が機能しない理由: 主要LLMは類似した学習データで訓練され同じ間違いをする傾向。全員が同方向に誤る可能性がある
  • 理論的根拠: Xu et al.「Hallucination is Inevitable」(2024)、Banerjee et al.「LLMs Will Always Hallucinate」(2024)でハルシネーションの完全排除は原理的困難と示されている