カイ二乗独立性検定を行う問題です。
1. 仮説の設定
問題文から、以下の仮説を設定します:
- 帰無仮説 $H_0$: 喫煙習慣と高血圧の間に関連はない(独立である)
- 対立仮説 $H_1$: 喫煙習慣と高血圧の間に関連がある(独立ではない)
2. 期待度数の計算
帰無仮説のもとでの期待度数は、行の合計と列の合計から計算されます:
$E_{ij} = \frac{R_i \times C_j}{n}$
ここで、$R_i$ は行 $i$ の合計、$C_j$ は列 $j$ の合計、$n$ は総数です。
各セルの期待度数を計算します:
- 喫煙者・高血圧あり: $E_{11} = \frac{120 \times 105}{300} = 42$
- 喫煙者・高血圧なし: $E_{12} = \frac{120 \times 195}{300} = 78$
- 非喫煙者・高血圧あり: $E_{21} = \frac{180 \times 105}{300} = 63$
- 非喫煙者・高血圧なし: $E_{22} = \frac{180 \times 195}{300} = 117$
3. 検定統計量の計算
カイ二乗独立性検定の検定統計量 $\chi^2$ は以下の式で計算されます:
$\chi^2 = \sum_{i=1}^{r} \sum_{j=1}^{c} \frac{(O_{ij} - E_{ij})^2}{E_{ij}}$
ここで、$O_{ij}$ は観測度数、$E_{ij}$ は期待度数、$r$ は行の数、$c$ は列の数です。
与えられた情報を代入します:
\begin{align}
\chi^2 &= \frac{(45 - 42)^2}{42} + \frac{(75 - 78)^2}{78} + \frac{(60 - 63)^2}{63} + \frac{(120 - 117)^2}{117} \\
&= \frac{9}{42} + \frac{9}{78} + \frac{9}{63} + \frac{9}{117} \\
&= 0.214 + 0.115 + 0.143 + 0.077 \\
&= 0.549
\end{align}
4. 自由度とp値の計算
カイ二乗独立性検定の自由度は $df = (r - 1) \times (c - 1)$ です。ここで、$r$ は行の数、$c$ は列の数です。この問題では、$r = 2$(喫煙者と非喫煙者)、$c = 2$(高血圧ありとなし)なので、$df = (2 - 1) \times (2 - 1) = 1$ となります。
自由度1のカイ二乗分布において、検定統計量 $\chi^2 = 0.549$ に対応するp値を計算します:
$p\text{値} = P(\chi^2_1 > 0.549) \approx 0.459$
この計算では、$p\text{値} \approx 0.459$ となります。
5. 選択肢の検討
計算されたp値 $p \approx 0.459$ に最も近い選択肢は「0.46」です。
p値が大きい(通常は0.05以上)場合、帰無仮説を棄却する十分な証拠がないと判断します。この問題では、$p \approx 0.459 > 0.05$ なので、喫煙習慣と高血圧の間に関連がないという帰無仮説を棄却できません。つまり、このデータからは、喫煙習慣と高血圧の間に統計的に有意な関連があるとは言えません。
また、2×2の分割表では、イェーツの連続性補正を適用することがあります。連続性補正を適用すると、検定統計量はさらに小さくなり、p値はさらに大きくなります。