サンプルサイズ設計による計算
統計的検定において、研究開始前に必要なサンプルサイズを決定する検出力分析について説明します。
検出力分析の理論的基礎
Step 1: 検出力分析の4要素
統計的検定における4つの関連要素:
- 効果量(Effect Size):$d = \frac{|\mu_1 - \mu_2|}{\sigma}$
- 有意水準(Type I Error):$\alpha$
- 検出力(Power):$1 - \beta$($\beta$は第2種の誤り)
- サンプルサイズ:$n$
これらのうち3つが決まれば、残り1つが決定されます。
Step 2: 2標本t検定の設定
2標本t検定の仮説:
$H_0: \mu_1 = \mu_2 \quad \text{vs} \quad H_1: \mu_1 \neq \mu_2$
検定統計量:
$t = \frac{\bar{X_1} - \bar{X_2}}{s_p\sqrt{\frac{1}{n_1} + \frac{1}{n_2}}}$
ここで$s_p$は合併分散です。
効果量とサンプルサイズの関係
Step 3: 効果量の定義(コーエンの$d$)
標準化された効果量:
$d = \frac{|\mu_1 - \mu_2|}{\sigma}$
効果量の解釈基準:
- 小さい効果:$d = 0.2$
- 中程度の効果:$d = 0.5$
- 大きい効果:$d = 0.8$
Step 4: 等サンプルサイズの場合の簡素化
$n_1 = n_2 = n$の場合、検定統計量は:
$t = \frac{\bar{X_1} - \bar{X_2}}{s_p\sqrt{\frac{2}{n}}}$
効果量との関係:
$\delta = d\sqrt{\frac{n}{2}}$
ここで$\delta$は非心度パラメータです。
サンプルサイズ公式の導出
Step 5: 検出力の定義
検出力は対立仮説の下で帰無仮説を正しく棄却する確率:
$\text{Power} = P(|t| > t_{\alpha/2, 2n-2} | H_1 \text{ is true})$
Step 6: 正規近似による公式
大標本近似では、必要サンプルサイズの公式:
$n = \frac{2(z_{\alpha/2} + z_{\beta})^2}{d^2}$
ここで:
- $z_{\alpha/2}$:両側検定の臨界値
- $z_{\beta}$:第2種の誤りに対応する値
数値計算の実行
Step 7: 与えられた条件の整理
設計パラメータ:
- 効果量:$d = 0.5$
- 有意水準:$\alpha = 0.05$(両側)
- 検出力:$1 - \beta = 0.80$、つまり$\beta = 0.20$
Step 8: 臨界値の決定
標準正規分布の分位点:
- $z_{\alpha/2} = z_{0.025} = 1.96$
- $z_{\beta} = z_{0.20} = 0.84$
Step 9: サンプルサイズの計算
$n = \frac{2(z_{\alpha/2} + z_{\beta})^2}{d^2} = \frac{2(1.96 + 0.84)^2}{(0.5)^2}$
$= \frac{2 \times (2.80)^2}{0.25} = \frac{2 \times 7.84}{0.25} = \frac{15.68}{0.25} = 62.72$
したがって、各群に必要な最小サンプルサイズは$n = 63$(切り上げ)です。