カイ二乗適合度検定の統計量を計算する問題です。
カイ二乗適合度検定
カイ二乗適合度検定は、観測されたデータが理論的な分布や仮説と一致するかを検定する手法です。
カイ二乗統計量の公式
基本公式:
$\chi^2 = \sum_{i=1}^{k} \frac{(O_i - E_i)^2}{E_i}$
ここで:
- $O_i$:第i番目のカテゴリの観測度数
- $E_i$:第i番目のカテゴリの期待度数
- $k$:カテゴリ数
計算手順
与えられたデータ:
- 観測度数:[18, 22, 20]
- 期待度数:[20, 20, 20]
- カテゴリ数:k = 3
各カテゴリの計算:
カテゴリ1:
$\frac{(O_1 - E_1)^2}{E_1} = \frac{(18 - 20)^2}{20} = \frac{(-2)^2}{20} = \frac{4}{20} = 0.20$
カテゴリ2:
$\frac{(O_2 - E_2)^2}{E_2} = \frac{(22 - 20)^2}{20} = \frac{2^2}{20} = \frac{4}{20} = 0.20$
カテゴリ3:
$\frac{(O_3 - E_3)^2}{E_3} = \frac{(20 - 20)^2}{20} = \frac{0^2}{20} = \frac{0}{20} = 0.00$
合計:
$\chi^2 = 0.20 + 0.20 + 0.00 = 0.40$
カイ二乗検定のポイント
自由度の決定:
- 基本: df = カテゴリ数 - 1
- この例: df = 3 - 1 = 2
- 母数推定: データから母数を推定した場合はさらに減る
適用条件:
- 期待度数の条件: 各セルの期待度数が5以上
- 独立性: 各観測が独立
- カテゴリの排他性: 各観測は1つのカテゴリにのみ属する
統計量の解釈:
- χ² = 0:完全に一致
- 値が大きいほど理論値からの乖離が大きい
- 有意であれば帰無仮説(適合している)を棄却
カイ二乗統計量は常に非負の値をとり、観測値と期待値が完全に一致する場合にのみ0になります。期待度数が小さい場合(一般的に5未満)は、正確検定やフィッシャーの正確検定を検討する必要があります。
したがって、カイ二乗統計量は0.40です。