機械学習編

基礎的な機械学習ロジックの理解を問います

混同行列: 精度 (Accuracy) の計算 レベル1

ある二値分類モデルのテスト結果から得られた混同行列が以下の通りです。\begin{array}{|c|c|c|} \hline & \text{予測: Positive} & \text{予測: Negative} \\ \hline \text{実際: Positive} & \text{TP = 80} & \text{FN = 20} \\ \hline \text{実際: Negative} & \text{FP = 10} & \text{TN = 90} \\ \hline \end{array} このモデルの精度 (Accuracy) を計算してください。精度 = \(\frac{TP+TN}{\text{全データ数}}\) 。

解説
解答と解説を表示
<h4>精度 (Accuracy) とは?</h4> <p>精度(正解率)は、分類モデルの性能評価指標の中で最も直感的に理解しやすいものです。<strong>全ての予測のうち、正しかった予測(真陽性 TP と 真陰性 TN)の割合</strong>を示します。</p> <h4>計算方法</h4> <p>混同行列の要素を用いて計算します。</p> <ul> <li>TP (True Positive) = 80</li> <li>TN (True Negative) = 90</li> <li>FP (False Positive) = 10</li> <li>FN (False Negative) = 20</li> </ul> <p>1. <strong>正しく分類されたデータ数:</strong></p> <div class="formula"> $ TP + TN = 80 + 90 = 170$ </div> <p>2. <strong>全データ数:</strong></p> <div class="formula"> $ TP + TN + FP + FN = 80 + 90 + 10 + 20 = 200$ </div> <p>3. <strong>精度の計算:</strong></p> <div class="formula"> $\text{精度 (Accuracy)} = \frac{TP + TN}{\text{全データ数}} = \frac{170}{200} = 0.85$ </div> <p>したがって、このモデルの精度は <strong>0.85</strong> (または 85%) です。</p> <div class="key-point"> <div class="key-point-title">重要ポイント:精度の限界(不均衡データ)</div> <p>精度は分かりやすい反面、<strong>クラス間のデータ数に大きな偏り(不均衡)がある場合</strong>には注意が必要です。例えば、非常にまれな病気(陽性クラスが少ない)を検出するモデルを考えます。もしモデルが全ての患者を「陰性」と予測しても、ほとんどの患者は実際に陰性であるため、精度は非常に高くなります。しかし、このモデルは病気を見つけるという本来の目的を果たせていません。</p> <p>このような場合、精度だけではなく、<strong>適合率 (Precision)</strong>, <strong>再現率 (Recall)</strong>, <strong>F1スコア</strong> など、他の指標も併せて評価することが不可欠です。これらの指標は、特定のクラス(通常は少数派の陽性クラス)に対する性能をより詳細に評価するのに役立ちます。</p> </div>
問題 1/1
カテゴリ一覧に戻る