この問題ではベイズの定理を用いた事後確率の計算を学習します。検査結果(データ)が得られた後に、原因(不良品かどうか)の確率をどう更新するかという、機械学習やAI診断の根幹をなす理論です。
ベイズの定理の適用
事象 $A$:製品が不良、事象 $B$:検査が陽性 とします。
- 事前確率 $P(A) = 0.02$ (不良率)
- 感度 $P(B|A) = 0.90$ (不良品を陽性と判定する確率)
- 特異度 $P(\bar{B}|\bar{A}) = 0.95$ → 偽陽性率 $P(B|\bar{A}) = 1 - 0.95 = 0.05$
求めるのは事後確率 $P(A|B)$ です。
$P(A|B) = \frac{P(B|A)P(A)}{P(B)}$
1. 周辺確率 $P(B)$ の計算
検査が陽性になる確率は、不良品が陽性になる場合と、良品が陽性になる場合の和です。
$P(B) = P(B|A)P(A) + P(B|\bar{A})P(\bar{A})$
$= 0.90 \times 0.02 + 0.05 \times (1 - 0.02)$
$= 0.018 + 0.05 \times 0.98$
$= 0.018 + 0.049 = 0.067$
2. 事後確率の計算
$P(A|B) = \frac{0.018}{0.067} = \frac{18}{67} \approx 0.2687$
直感との乖離
感度90%の検査で陽性が出ても、実際に不良品である確率は27%弱しかありません。これは元の不良率(事前確率)が2%と低いため、偽陽性の数(良品の5%)が真陽性の数を上回ってしまうためです(「ベースレートの誤謬」)。