Dev Classmethod Jp Articles Llm Birth History Turing Shannon Transforme 3e9bef45

「失敗の積み重ね」がLLMを生んだ（後編）— Attentionからスケール革命、そして整列へ

URL: https://dev.classmethod.jp/articles/llm-birth-history-turing-shannon-transformer-gpt3-part2
日付: 2026-06-25
Tier: Tier 2
要旨: Attentionからスケール革命まで、LLMの各段階を構成した技術的突破を歩んだ。RNNのスナップショット問題を解決したAttention、これを逐次処理から解放したTransformer、データとスケールの相互作用で閾値を越えたGPT-3、そしてRLHFで人間意図に整列させたInstructGPTまで。現在は推論時計算と合成データが新たな進化軸になっている。

詳細

Attention機構は機械翻訳のスナップショット問題から生まれた実用的なパッチだ。RNNは逐次処理で文脈を保つが、古い情報ほど勾配が消える。バダナウらが考えた解決策は、各時点の隠れ状態を完全コピーで保持し、出力側から関連性スコアに基づいて取得する仕組み。これが勾配消失も緩和し、何十年も前の構想が2014年に花開いた。Transformerはこの洞察をさらに推し進め、RNN自体を捨てた。Self-Attentionで全トークンが互いを参照でき、位置情報を埋め込むことで並列処理が可能になった。結果として訓練速度が劇的に向上し、より大規模なモデルへの道が開かれた。スケール則が示す通り、性能はパラメータ数、データ量、計算量に対して予測可能に改善する。GPT-3はこの法則を極限まで押し進めたが、2024年頃からはデータ枯渇とコスト限界に直面している。現在のフロンティアは事後学習（RLHF/DPO）の深化、推論時計算への投資、合成データと蒸留による効率化へシフトしている。

Dev Classmethod Jp Articles Llm Birth History Turing Shannon Transforme 34f32e97 Dev Classmethod Jp Articles Llm Extended Thinking Token Prediction Prom 3b260bc0