精度 (Accuracy) とは?
精度(正解率)は、分類モデルの性能評価指標の中で最も直感的に理解しやすいものです。全ての予測のうち、正しかった予測(真陽性 TP と 真陰性 TN)の割合を示します。
計算方法
混同行列の要素を用いて計算します。
- TP (True Positive) = 80
- TN (True Negative) = 90
- FP (False Positive) = 10
- FN (False Negative) = 20
1. 正しく分類されたデータ数:
$ TP + TN = 80 + 90 = 170$
2. 全データ数:
$ TP + TN + FP + FN = 80 + 90 + 10 + 20 = 200$
3. 精度の計算:
$\text{精度 (Accuracy)} = \frac{TP + TN}{\text{全データ数}} = \frac{170}{200} = 0.85$
したがって、このモデルの精度は 0.85 (または 85%) です。
重要ポイント:精度の限界(不均衡データ)
精度は分かりやすい反面、クラス間のデータ数に大きな偏り(不均衡)がある場合には注意が必要です。例えば、非常にまれな病気(陽性クラスが少ない)を検出するモデルを考えます。もしモデルが全ての患者を「陰性」と予測しても、ほとんどの患者は実際に陰性であるため、精度は非常に高くなります。しかし、このモデルは病気を見つけるという本来の目的を果たせていません。
このような場合、精度だけではなく、適合率 (Precision), 再現率 (Recall), F1スコア など、他の指標も併せて評価することが不可欠です。これらの指標は、特定のクラス(通常は少数派の陽性クラス)に対する性能をより詳細に評価するのに役立ちます。