イエーツの補正(連続性補正)
離散分布であるカイ二乗分布を連続分布で近似する際の補正法について説明します。
イエーツの補正の理論的基礎
Step 1: 2×2分割表の表記
2×2分割表を以下のように表記します:
| 列1 | 列2 | 計 |
|---|
| 行1 | $a$ | $b$ | $a+b$ |
| 行2 | $c$ | $d$ | $c+d$ |
| 計 | $a+c$ | $b+d$ | $n=a+b+c+d$ |
与えられた値:$a=12, b=8, c=6, d=14$
Step 2: 通常のカイ二乗統計量
補正なしのカイ二乗統計量:
$\chi^2 = \frac{n(ad-bc)^2}{(a+b)(c+d)(a+c)(b+d)}$
Step 3: イエーツの補正の適用
イエーツの補正を適用した統計量:
$\chi^2_{Yates} = \frac{n(|ad-bc|-n/2)^2}{(a+b)(c+d)(a+c)(b+d)}$
連続性補正として$n/2$を減算します。
数値計算の実行
Step 4: 基本統計量の計算
各周辺和の計算:
- $a+b = 12+8 = 20$
- $c+d = 6+14 = 20$
- $a+c = 12+6 = 18$
- $b+d = 8+14 = 22$
- $n = a+b+c+d = 40$
Step 5: 分子の計算
まず$ad-bc$を計算:
$ad-bc = 12 \times 14 - 8 \times 6 = 168 - 48 = 120$
イエーツの補正適用:
$|ad-bc| - \frac{n}{2} = |120| - \frac{40}{2} = 120 - 20 = 100$
分子:
$(|ad-bc| - n/2)^2 = 100^2 = 10000$
Step 6: 分母の計算
分母の各要素:
$(a+b)(c+d)(a+c)(b+d) = 20 \times 20 \times 18 \times 22$
$= 400 \times 18 \times 22 = 400 \times 396 = 158400$
Step 7: 最終計算
イエーツの補正を適用した統計量:
$\chi^2_{Yates} = \frac{n \times (|ad-bc| - n/2)^2}{(a+b)(c+d)(a+c)(b+d)}$
$= \frac{40 \times 10000}{158400} = \frac{400000}{158400} = 2.435...$
イエーツの補正の特徴
- 連続性補正:離散分布の連続近似における補正
- 保守的効果:統計量を小さくし、第1種の誤りを減少
- 適用条件:小標本や期待度数が小さい場合
- 精度向上:正確確率検定に近い結果