AIC、BIC、交差検証、ROC曲線、混合行列など、統計モデルの選択と評価に関する手法
以下の混合行列から、適合率(Precision)、再現率(Recall)、F1スコアを計算せよ。 <table style='border-collapse: collapse; margin: 1em auto; text-align: center;'> <tr> <td style='border: none;'></td> <td style='border: none;'></td> <td colspan='2' style='border: 1px solid #ddd; padding: 8px; background-color: #f0f8ff;'><strong>予測値</strong></td> </tr> <tr> <td style='border: none;'></td> <td style='border: none;'></td> <td style='border: 1px solid #ddd; padding: 8px; background-color: #f5f5f5;'><strong>正例</strong></td> <td style='border: 1px solid #ddd; padding: 8px; background-color: #f5f5f5;'><strong>負例</strong></td> </tr> <tr> <td rowspan='2' style='border: 1px solid #ddd; padding: 8px; background-color: #f0f8ff; writing-mode: vertical-lr;'><strong>実際値</strong></td> <td style='border: 1px solid #ddd; padding: 8px; background-color: #f5f5f5;'><strong>正例</strong></td> <td style='border: 1px solid #ddd; padding: 8px; background-color: #e8f5e8;'><strong>80</strong></td> <td style='border: 1px solid #ddd; padding: 8px; background-color: #ffe8e8;'><strong>20</strong></td> </tr> <tr> <td style='border: 1px solid #ddd; padding: 8px; background-color: #f5f5f5;'><strong>負例</strong></td> <td style='border: 1px solid #ddd; padding: 8px; background-color: #ffe8e8;'><strong>15</strong></td> <td style='border: 1px solid #ddd; padding: 8px; background-color: #e8f5e8;'><strong>85</strong></td> </tr> </table>
実用的解釈:このモデルが「正例」と予測した場合、約84.2%の確率で実際に正例です。
Step 3: 再現率(Recall)の計算
定義:「実際の正例のうち、正しく検出できた割合」
実用的解釈:実際の正例の80%を正しく検出できています。20%は見逃しています。
Step 4: F1スコアの計算
定義:適合率と再現率の調和平均
指標 | 値 | 重視する場面 | 例 |
---|---|---|---|
適合率 | 84.2% | 偽陽性コストが高い | スパム検出、投資判断 |
再現率 | 80.0% | 偽陰性コストが高い | 医療診断、セキュリティ |
F1スコア | 82.1% | バランス重視 | 一般的な分類問題 |
Step 5: その他の重要指標
精度(Accuracy):
特異度(Specificity):