混同行列 (Confusion Matrix) とは
混同行列は、分類モデル(特に二値分類)の性能を評価するための基本的なツールです。モデルの予測が実際のクラスに対してどのように分布しているかを視覚的に示します。
混同行列の要素
- TP (True Positive): 実際に陽性のものを正しく陽性と予測した数。(例: 病気の人を病気と診断)
- FN (False Negative): 実際に陽性のものを誤って陰性と予測した数。(例: 病気の人を健康と診断 → 見逃し)
- FP (False Positive): 実際に陰性のものを誤って陽性と予測した数。(例: 健康な人を病気と診断 → 誤報)
- TN (True Negative): 実際に陰性のものを正しく陰性と予測した数。(例: 健康な人を健康と診断)
問題の行列では、TP=85, FN=15, FP=20, TN=80 です。
再現率 (Recall, Sensitivity, 真陽性率)
再現率は、実際に陽性であるサンプル全体のうち、モデルがどれだけ正しく「陽性」と予測できたかの割合を示します。「見逃し」をどれだけ防げたかの指標です。
$ 再現率 (Recall) = \frac{TP}{実際に陽性の数} = \frac{TP}{TP + FN}$
計算
$再現率 = \frac{85}{85 + 15} = \frac{85}{100} = 0.85$
したがって、このモデルの再現率は 0.85 です。これは、実際に陽性であるサンプルの85%をモデルが正しく検出できたことを意味します。
重要ポイント:再現率 vs 適合率
- 再現率 (Recall): 実際の陽性クラスに対する網羅性を示す。偽陰性 (FN, 見逃し) を減らすことが目標。FNのコストが高い場合(例: 病気の見逃し)に特に重要。
- 適合率 (Precision): モデルが陽性と予測したものの正確性を示す (\(\frac{TP}{TP+FP}\))。偽陽性 (FP, 誤報) を減らすことが目標。FPのコストが高い場合(例: スパム判定)に特に重要。今回の例では適合率は \(\frac{85}{85 + 20} = \frac{85}{105} \approx 0.81 \) です。
- トレードオフ: 一般的に、再現率と適合率はトレードオフの関係にあります。一方を改善しようとすると、もう一方が悪化する傾向があります。
- F1スコア: 再現率と適合率のバランスを取るための指標(調和平均)です。