モデル選択・評価

AIC、BIC、交差検証、ROC曲線、混合行列など、統計モデルの選択と評価に関する手法

混合行列の計算 レベル1

以下の混合行列から、適合率(Precision)、再現率(Recall)、F1スコアを計算せよ。 <table style='border-collapse: collapse; margin: 1em auto; text-align: center;'> <tr> <td style='border: none;'></td> <td style='border: none;'></td> <td colspan='2' style='border: 1px solid #ddd; padding: 8px; background-color: #f0f8ff;'><strong>予測値</strong></td> </tr> <tr> <td style='border: none;'></td> <td style='border: none;'></td> <td style='border: 1px solid #ddd; padding: 8px; background-color: #f5f5f5;'><strong>正例</strong></td> <td style='border: 1px solid #ddd; padding: 8px; background-color: #f5f5f5;'><strong>負例</strong></td> </tr> <tr> <td rowspan='2' style='border: 1px solid #ddd; padding: 8px; background-color: #f0f8ff; writing-mode: vertical-lr;'><strong>実際値</strong></td> <td style='border: 1px solid #ddd; padding: 8px; background-color: #f5f5f5;'><strong>正例</strong></td> <td style='border: 1px solid #ddd; padding: 8px; background-color: #e8f5e8;'><strong>80</strong></td> <td style='border: 1px solid #ddd; padding: 8px; background-color: #ffe8e8;'><strong>20</strong></td> </tr> <tr> <td style='border: 1px solid #ddd; padding: 8px; background-color: #f5f5f5;'><strong>負例</strong></td> <td style='border: 1px solid #ddd; padding: 8px; background-color: #ffe8e8;'><strong>15</strong></td> <td style='border: 1px solid #ddd; padding: 8px; background-color: #e8f5e8;'><strong>85</strong></td> </tr> </table>

解説
解答と解説を表示
<p>この問題では、<strong>混合行列から導出される評価指標</strong>の詳細な計算と、それぞれの実用的な意味について理解を深めます。混合行列は分類性能の総合的な評価基盤となるツールです。</p><h4>混合行列の詳細分析</h4><p class='step'><strong>Step 1: 混合行列の要素確認</strong></p><p>与えられた混合行列から各要素を特定:</p><div class='key-point'><table style='width:70%; border-collapse: collapse; margin: 1em auto; text-align: center;'><tr><td style='border: none;'></td><td style='border: none;'></td><td colspan='2' style='border: 1px solid #ddd; padding: 8px; background-color: #f0f8ff;'><strong>予測値</strong></td></tr><tr><td style='border: none;'></td><td style='border: none;'></td><td style='border: 1px solid #ddd; padding: 8px; background-color: #f5f5f5;'><strong>正例</strong></td><td style='border: 1px solid #ddd; padding: 8px; background-color: #f5f5f5;'><strong>負例</strong></td></tr><tr><td rowspan='2' style='border: 1px solid #ddd; padding: 8px; background-color: #f0f8ff; writing-mode: vertical-lr;'><strong>実際値</strong></td><td style='border: 1px solid #ddd; padding: 8px; background-color: #f5f5f5;'><strong>正例</strong></td><td style='border: 1px solid #ddd; padding: 8px; background-color: #e8f5e8;'><strong>80</strong><br>(TP)</td><td style='border: 1px solid #ddd; padding: 8px; background-color: #ffe8e8;'><strong>20</strong><br>(FN)</td></tr><tr><td style='border: 1px solid #ddd; padding: 8px; background-color: #f5f5f5;'><strong>負例</strong></td><td style='border: 1px solid #ddd; padding: 8px; background-color: #ffe8e8;'><strong>15</strong><br>(FP)</td><td style='border: 1px solid #ddd; padding: 8px; background-color: #e8f5e8;'><strong>85</strong><br>(TN)</td></tr></table></div><ul><li><strong>TP (True Positive)</strong> = 80:正しく正例と予測</li><li><strong>FN (False Negative)</strong> = 20:正例を負例と誤分類</li><li><strong>FP (False Positive)</strong> = 15:負例を正例と誤分類</li><li><strong>TN (True Negative)</strong> = 85:正しく負例と予測</li></ul><p class='step'><strong>Step 2: 適合率(Precision)の計算</strong></p><p><strong>定義:</strong>「正例と予測したもののうち、実際に正例だった割合」</p><div class='formula'>$\text{Precision} = \frac{TP}{TP + FP} = \frac{\text{正しい正例予測}}{\text{全正例予測}}$
$= \frac{80}{80 + 15} = \frac{80}{95} = 0.8421... \approx 0.842$

実用的解釈:このモデルが「正例」と予測した場合、約84.2%の確率で実際に正例です。

Step 3: 再現率(Recall)の計算

定義:「実際の正例のうち、正しく検出できた割合」

$\text{Recall} = \frac{TP}{TP + FN} = \frac{\text{正しい正例予測}}{\text{実際の全正例}}$
$= \frac{80}{80 + 20} = \frac{80}{100} = 0.800$

実用的解釈:実際の正例の80%を正しく検出できています。20%は見逃しています。

Step 4: F1スコアの計算

定義:適合率と再現率の調和平均

$\text{F1} = \frac{2 \times \text{Precision} \times \text{Recall}}{\text{Precision} + \text{Recall}}$
$= \frac{2 \times 0.842 \times 0.800}{0.842 + 0.800}$
$= \frac{2 \times 0.6736}{1.642} = \frac{1.3472}{1.642} = 0.8205... \approx 0.821$
各指標の特徴と使い分け
指標重視する場面
適合率84.2%偽陽性コストが高いスパム検出、投資判断
再現率80.0%偽陰性コストが高い医療診断、セキュリティ
F1スコア82.1%バランス重視一般的な分類問題

追加的な評価指標

Step 5: その他の重要指標

精度(Accuracy):

$\text{Accuracy} = \frac{TP + TN}{TP + TN + FP + FN} = \frac{80 + 85}{200} = 0.825$

特異度(Specificity):

$\text{Specificity} = \frac{TN}{TN + FP} = \frac{85}{85 + 15} = 0.850$</div><p class='note'><strong>実践的な示唆:</strong><br>このモデルは適合率と再現率のバランスが良く、F1スコア82.1%は実用的なレベルです。ただし、再現率が80%ということは、5人に1人の正例を見逃していることを意味するため、アプリケーションによっては改善が必要かもしれません。</p>
問題 1/10
カテゴリ一覧に戻る