混同行列: 精度 (Accuracy) の計算 - 問題演習問題8

混同行列: 精度 (Accuracy) の計算レベル1

ある二値分類モデルのテスト結果から得られた混同行列が以下の通りです。\begin{array}{|c|c|c|}
\hline
& \text{予測: Positive} & \text{予測: Negative} \\
\hline
\text{実際: Positive} & \text{TP = 80} & \text{FN = 20} \\
\hline
\text{実際: Negative} & \text{FP = 10} & \text{TN = 90} \\
\hline
\end{array}
このモデルの精度 (Accuracy) を計算してください。精度 = $\frac{TP+TN}{\text{全データ数}}$ 。

解説

解答と解説を表示

精度 (Accuracy) とは？

精度（正解率）は、分類モデルの性能評価指標の中で最も直感的に理解しやすいものです。全ての予測のうち、正しかった予測（真陽性 TP と真陰性 TN）の割合を示します。

計算方法

混同行列の要素を用いて計算します。

TP (True Positive) = 80
TN (True Negative) = 90
FP (False Positive) = 10
FN (False Negative) = 20

1. 正しく分類されたデータ数:

$ TP + TN = 80 + 90 = 170$

2. 全データ数:

$ TP + TN + FP + FN = 80 + 90 + 10 + 20 = 200$

3. 精度の計算:

$\text{精度 (Accuracy)} = \frac{TP + TN}{\text{全データ数}} = \frac{170}{200} = 0.85$

したがって、このモデルの精度は 0.85 (または 85%) です。

重要ポイント：精度の限界（不均衡データ）

精度は分かりやすい反面、クラス間のデータ数に大きな偏り（不均衡）がある場合には注意が必要です。例えば、非常にまれな病気（陽性クラスが少ない）を検出するモデルを考えます。もしモデルが全ての患者を「陰性」と予測しても、ほとんどの患者は実際に陰性であるため、精度は非常に高くなります。しかし、このモデルは病気を見つけるという本来の目的を果たせていません。

このような場合、精度だけではなく、適合率 (Precision), 再現率 (Recall), F1スコア など、他の指標も併せて評価することが不可欠です。これらの指標は、特定のクラス（通常は少数派の陽性クラス）に対する性能をより詳細に評価するのに役立ちます。

機械学習編