<p>この問題では、分類モデルの性能を評価する最も基本的でツールである<strong>混合行列(Confusion Matrix)</strong>について理解を深めます。</p><h4>混合行列とは?</h4><p>混合行列は、分類モデルの予測結果と実際の正解を<strong>クロス集計表</strong>の形で整理したものです。モデルがどのような間違いをしているかを詳細に把握でき、様々な評価指標の計算基盤となります。</p><h4>2クラス分類における混合行列の構成</h4><p>2クラス分類問題では、混合行列は以下のような2×2の表で表現されます:</p><table style='width:70%; border-collapse: collapse; margin: 1em auto; text-align: center;'><tr><td style='border: none;'></td><td style='border: none;'></td><td colspan='2' style='border: 1px solid #ddd; padding: 8px; background-color: #f0f8ff;'><strong>予測値</strong></td></tr><tr><td style='border: none;'></td><td style='border: none;'></td><td style='border: 1px solid #ddd; padding: 8px; background-color: #f5f5f5;'><strong>正例</strong></td><td style='border: 1px solid #ddd; padding: 8px; background-color: #f5f5f5;'><strong>負例</strong></td></tr><tr><td rowspan='2' style='border: 1px solid #ddd; padding: 8px; background-color: #f0f8ff; writing-mode: vertical-lr;'><strong>実際値</strong></td><td style='border: 1px solid #ddd; padding: 8px; background-color: #f5f5f5;'><strong>正例</strong></td><td style='border: 1px solid #ddd; padding: 8px; background-color: #e8f5e8;'><strong>TP</strong><br>(True Positive)</td><td style='border: 1px solid #ddd; padding: 8px; background-color: #ffe8e8;'><strong>FN</strong><br>(False Negative)</td></tr><tr><td style='border: 1px solid #ddd; padding: 8px; background-color: #f5f5f5;'><strong>負例</strong></td><td style='border: 1px solid #ddd; padding: 8px; background-color: #ffe8e8;'><strong>FP</strong><br>(False Positive)</td><td style='border: 1px solid #ddd; padding: 8px; background-color: #e8f5e8;'><strong>TN</strong><br>(True Negative)</td></tr></table><h4>各要素の詳細な定義</h4><p class='step'>1. True Positive (TP) - 真陽性</p><p>実際に正例であり、モデルも正例と<strong>正しく予測</strong>したケース。理想的な予測結果です。</p><p class='step'>2. True Negative (TN) - 真陰性</p><p>実際に負例であり、モデルも負例と<strong>正しく予測</strong>したケース。これも理想的な予測結果です。</p><p class='step'>3. False Positive (FP) - 偽陽性(第1種の誤り)</p><p>実際は負例なのに、モデルが正例と<strong>誤って予測</strong>したケース。「偽のアラーム」とも呼ばれます。</p><p class='step'>4. False Negative (FN) - 偽陰性(第2種の誤り)</p><p>実際は正例なのに、モデルが負例と<strong>誤って予測</strong>したケース。「見逃し」とも呼ばれます。</p><div class='key-point'><div class='key-point-title'>混合行列から計算される主要な評価指標</div><p><strong>1. 精度(Accuracy)</strong></p><div class='formula'>$\text{Accuracy} = \frac{TP + TN}{TP + TN + FP + FN}
lt;/div><p>全体の予測のうち、正しく分類された割合。最も直感的な指標ですが、クラス不均衡がある場合は注意が必要です。</p><p><strong>2. 適合率(Precision)</strong></p><div class='formula'>$\text{Precision} = \frac{TP}{TP + FP}
lt;/div><p>正例と予測したもののうち、実際に正例だった割合。「予測の信頼性」を表します。</p><p><strong>3. 再現率(Recall / Sensitivity)</strong></p><div class='formula'>$\text{Recall} = \frac{TP}{TP + FN}
lt;/div><p>実際の正例のうち、正しく検出できた割合。「検出能力」を表します。</p><p><strong>4. 特異度(Specificity)</strong></p><div class='formula'>$\text{Specificity} = \frac{TN}{TN + FP}
lt;/div><p>実際の負例のうち、正しく負例と判定できた割合。「負例の検出能力」を表します。</p></div><h4>評価指標の使い分け</h4><p><strong>精度(Accuracy)が適している場合:</strong></p><ul><li>クラスが均衡している場合</li><li>全体的な性能を簡単に把握したい場合</li></ul><p><strong>適合率(Precision)を重視すべき場合:</strong></p><ul><li>偽陽性(FP)のコストが高い場合</li><li>例:スパムメール検出(重要メールを誤ってスパム判定するリスク)</li></ul><p><strong>再現率(Recall)を重視すべき場合:</strong></p><ul><li>偽陰性(FN)のコストが高い場合</li><li>例:医療診断(病気を見逃すリスク)、セキュリティ検知</li></ul><h4>実際の解釈例</h4><p>医療診断システムの例で考えてみましょう:</p><ul><li><strong>TP</strong>:病気の患者を正しく「病気あり」と診断</li><li><strong>TN</strong>:健康な人を正しく「病気なし」と診断</li><li><strong>FP</strong>:健康な人を誤って「病気あり」と診断(過剰診断)</li><li><strong>FN</strong>:病気の患者を誤って「病気なし」と診断(見逃し)</li></ul><p>この場合、FN(見逃し)は患者の生命に関わるため、再現率を高めることが重要になります。</p><p class='note'><strong>実践的なポイント:</strong><br>混合行列は単なる数値の集計ではなく、ビジネス上の意思決定に直結する情報を提供します。どの指標を重視するかは、問題の性質とコストを考慮して決定する必要があります。また、適合率と再現率はトレードオフの関係にあることが多く、F1スコア(両者の調和平均)でバランスを評価することも重要です。</p>