Qiita Com Tateishi T Items 85af44e9d6fe11a047b4

Intel Mac 2018（i7/32GB）で動く“日本語OKなローカルLLM”を比較・選定する（準備編）

URL: https://qiita.com/tateishi-t/items/85af44e9d6fe11a047b4
日付: 2026-06-26
Tier: Tier 3
要旨: Intel Mac（2018、i7/32GB、内蔵GPU非力）でCPU推論できる日本語ローカルLLMを比較・選定した準備編。7B〜13B級のq4量子化モデルを対象に、日本語の自然さ・構造化力・体感速度・メモリフットプリント・ハルシネーション安定性の5軸で8モデルを比較している。ビジネス文書（議事録整形・メール下書き）への活用を主な用途として想定し、Llama 3.1 8B Instructを基準器として第1優先に、Qwen2.5 7Bを第2優先として選定している。次回記事でOllamaを使った実際のインストール・動作確認を扱う構成。

詳細

検証環境: MacBook Pro 15-inch 2018 / Intel Core i7 6コア / 32GB RAM / 内蔵Intel UHD 630 / macOS Sequoia 15.6
評価基準5軸: 日本語の自然さ（敬語・ビジネス文）、構造化力（要点抽出・章立て）、体感速度、メモリフットプリント（q4常用可否）、ハルシネーション安定性
主要候補モデル比較:
- Llama 3.1 8B Instruct（Meta）: q4メモリ5-6GB、日本語・速度・構造化のバランス最良 → 第1優先
- Qwen2.5 7B Instruct（Alibaba）: q4メモリ4-5GB、多言語強め → 第2優先
- Gemma 2 9B IT（Google DeepMind）: q4メモリ6-7GB、章立て・長文構造化の安定感 → 第3優先
- Mistral 7B Instruct v0.3: q4メモリ4-5GB、速度特化のバッチ処理向き
- ELYZA 13B: q4メモリ9-11GB、日本語ニュアンス精度特化（速度△）
- Phi-3.5-mini（3.8B）: q4メモリ2-3GB、超軽量だが長文・高度推論は苦手
推奨運用: Llama 3.1 8Bを基準器、速度重視日はMistral 7B、敬語精度を上げたい日はELYZA 13Bに差し替え
次回: brew install ollamaでインストール後、3モデルをpullして動作確認