効果量に基づく検出力分析とサンプルサイズ設計
この問題は、実際に意味のある効果を統計的に検出するために必要な標本サイズを計算する重要な設計問題です。効果量の概念を用いた実践的なアプローチを学習します。
問題設定の整理
- 従来法:平均70点、標準偏差10点
- 期待効果:5点以上の改善
- 効果量:d = 0.5(中程度の効果)
- 検出力:80%(β = 0.20)
- 有意水準:α = 0.05(両側検定)
Step 1: 効果量の確認
Cohen's dによる効果量は:
$$d = \frac{\mu_1 - \mu_2}{\sigma}$$
ここで:
- $\mu_1 - \mu_2 = 5$点(期待される平均点差)
- $\sigma = 10$点(共通の標準偏差)
- $d = 5/10 = 0.5$
効果量の解釈(Cohen's基準)
効果量d | 解釈 | 例 |
---|
0.2 | 小さな効果 | 身長の男女差の約20% |
0.5 | 中程度の効果 | 今回の設定 |
0.8 | 大きな効果 | 明確に識別可能な差 |
Step 2: 2標本t検定のサンプルサイズ公式
効果量d、有意水準α、検出力(1-β)が与えられたとき、各群の必要標本サイズは:
$$n = \frac{2(Z_{\alpha/2} + Z_\beta)^2}{d^2}$$
ここで:
- $Z_{\alpha/2} = Z_{0.025} = 1.96$(両側5%点)
- $Z_\beta = Z_{0.20} = 0.84$(検出力80%)
- $d = 0.5$(効果量)
Step 3: 数値の代入と計算
$$n = \frac{2(1.96 + 0.84)^2}{(0.5)^2} = \frac{2 \times (2.80)^2}{0.25}$$
$$n = \frac{2 \times 7.84}{0.25} = \frac{15.68}{0.25} = 62.7$$
標本サイズは整数である必要があるため:
$$n \geq 63$$
より正確な計算では、各群に64人が必要となります。
Step 4: 検出力の確認計算
n = 64のときの実際の検出力を確認:
$$\text{検出力} = \Phi\left(d\sqrt{\frac{n}{2}} - Z_{\alpha/2}\right)$$
$$\text{検出力} = \Phi\left(0.5\sqrt{\frac{64}{2}} - 1.96\right) = \Phi(0.5 \times 5.66 - 1.96)$$
$$\text{検出力} = \Phi(2.83 - 1.96) = \Phi(0.87) \approx 0.808$$
✓ 目標の80%を上回る約80.8%の検出力が得られます。
サンプルサイズと検出力の関係
各群のサイズ | 検出力 | 判定 |
---|
50人 | 74.2% | やや不足 |
60人 | 79.1% | ほぼ達成 |
64人 | 80.8% | 目標達成 |
80人 | 87.4% | 十分な検出力 |
Step 5: 異なる効果量での比較
同じ条件(α = 0.05、検出力80%)で他の効果量に必要な標本サイズ:
効果量別必要サンプルサイズ
効果量d | 各群のサイズ | 総サンプルサイズ |
---|
0.2 | 393人 | 786人 |
0.3 | 175人 | 350人 |
0.5 | 64人 | 128人 |
0.8 | 26人 | 52人 |
実際の研究設計での考慮事項
Step 6: 実践的な調整
- 脱落率:20%の脱落を想定すると $64 \div 0.8 = 80$人を最初に募集
- 不等分散:群間で分散が異なる場合はWelchのt検定を使用
- 一方向性:新方法が優れることが予想される場合は片側検定
- 多重比較:複数の比較がある場合は有意水準の調整が必要
片側検定の場合
新方法が改善することが明確に予想される場合、片側検定を使用できます:
$$n = \frac{2(Z_\alpha + Z_\beta)^2}{d^2}$$
$Z_{0.05} = 1.645$を使用すると:
$$n = \frac{2(1.645 + 0.84)^2}{0.25} = \frac{2 \times 6.17}{0.25} \approx 49.4$$
片側検定では各群50人で十分です。
Step 7: 効果量の事前推定
効果量の推定方法:
- 文献調査:類似研究からの効果量
- パイロット研究:小規模な予備調査
- 実践的意義:教育的に意味のある改善幅
- 専門家判断:教育者の経験に基づく推定
検出力分析の種類
分析タイプ | 目的 | 与えられる値 | 求める値 |
---|
事前分析 | 研究計画 | α, 効果量, 検出力 | サンプルサイズ |
事後分析 | 結果解釈 | α, 効果量, n | 検出力 |
感度分析 | 検出可能効果 | α, n, 検出力 | 効果量 |
研究の質を高める追加考慮事項
Step 8: 研究デザインの改善
- 層化:学力レベル別の層化により精度向上
- 共変量調整:事前テスト得点を共変量として使用
- 反復測定:被験者内設計による効率化
- 効果サイズの信頼区間:点推定だけでなく区間推定も報告