コンテンツにスキップ
Zenn Dev Terasawa Articles 146141d79806e2

友達から久々にLINEが来たので、マルチ勧誘リスクを機械学習で判定してみた

  • URL: https://zenn.dev/terasawa/articles/146141d79806e2
  • 日付: 2026-06-24
  • Tier: Tier 3
  • 要旨: 友人からのLINEメッセージをマルチ勧誘リスク分類するMLモデルを構築。累積メッセージの段階的パターンを学習し、どの段階でリスク検知されるかを分析。ChatGPTでシミュレーションデータ100件を生成、ロジスティック回帰で学習、FastAPI+React で推論エンドポイント実装。F1スコア0.92達成。LLMを補助手段として使いながら、データ設計・モデル選定・運用監視を人間主導で進めた実例。

詳細

ラベル設計の工夫が目立つ。単純な二値ではなく段階的多ラベル(再接触・目的曖昧・対面誘導・第三者紹介・副業訴求・総合リスク高)で、メッセージ累積による進行度を追跡。ChatGPT生成データだが、「メリットのある形でユーザーに利用させてもらう」データ戦略を記述。前処理(絵文字除外・形態素解析・n-gram・TF-IDF)を決定論的に組み込み。One-vs-RestClassifierで過学習を回避。重要なのはAccuracy/Precisionのバランス判定で、友達を失うリスクも考慮した運用視点。本番化時のログ実装・監視項目(分布シフト、予測値分布)も明記。