コンテンツにスキップ
Qiita Com Tateishi T Items 85af44e9d6fe11a047b4

Intel Mac 2018(i7/32GB)で動く“日本語OKなローカルLLM”を比較・選定する(準備編)

  • URL: https://qiita.com/tateishi-t/items/85af44e9d6fe11a047b4
  • 日付: 2026-06-26
  • Tier: Tier 3
  • 要旨: Intel Mac(2018、i7/32GB、内蔵GPU非力)でCPU推論できる日本語ローカルLLMを比較・選定した準備編。7B〜13B級のq4量子化モデルを対象に、日本語の自然さ・構造化力・体感速度・メモリフットプリント・ハルシネーション安定性の5軸で8モデルを比較している。ビジネス文書(議事録整形・メール下書き)への活用を主な用途として想定し、Llama 3.1 8B Instructを基準器として第1優先に、Qwen2.5 7Bを第2優先として選定している。次回記事でOllamaを使った実際のインストール・動作確認を扱う構成。

詳細

  • 検証環境: MacBook Pro 15-inch 2018 / Intel Core i7 6コア / 32GB RAM / 内蔵Intel UHD 630 / macOS Sequoia 15.6
  • 評価基準5軸: 日本語の自然さ(敬語・ビジネス文)、構造化力(要点抽出・章立て)、体感速度、メモリフットプリント(q4常用可否)、ハルシネーション安定性
  • 主要候補モデル比較:
    • Llama 3.1 8B Instruct(Meta): q4メモリ5-6GB、日本語・速度・構造化のバランス最良 → 第1優先
    • Qwen2.5 7B Instruct(Alibaba): q4メモリ4-5GB、多言語強め → 第2優先
    • Gemma 2 9B IT(Google DeepMind): q4メモリ6-7GB、章立て・長文構造化の安定感 → 第3優先
    • Mistral 7B Instruct v0.3: q4メモリ4-5GB、速度特化のバッチ処理向き
    • ELYZA 13B: q4メモリ9-11GB、日本語ニュアンス精度特化(速度△)
    • Phi-3.5-mini(3.8B): q4メモリ2-3GB、超軽量だが長文・高度推論は苦手
  • 推奨運用: Llama 3.1 8Bを基準器、速度重視日はMistral 7B、敬語精度を上げたい日はELYZA 13Bに差し替え
  • 次回: brew install ollamaでインストール後、3モデルをpullして動作確認