Tukey's HSD(Honestly Significant Difference)多重比較検定
分散分析で群間に有意差が認められた後、どの群間に具体的な差があるかを調べる手法です。Tukey法は全ての対比較を同時に行いながら、第1種過誤率を制御します。
多重比較の必要性
複数の群を対象とした分析では、多重性の問題により第1種過誤率が増大します。TukeyのHSD検定は、全ての対比較で全体の第1種過誤率をα以下に制御します。
Step 1: 問題設定の確認
| 処理 | 平均 | 標本サイズ |
|---|
| A | 15.2 | 5 |
| B | 18.6 | 5 |
| C | 21.4 | 5 |
| D | 16.8 | 5 |
- 群数:k = 4
- 各群のサイズ:n = 5(等サイズ)
- 群内平均平方:MSE = 2.4
- 有意水準:α = 0.05
Step 2: TukeyのHSD統計量の公式
等サイズの場合のHSD値:
$HSD = q_{\alpha,k,df} \sqrt{\frac{MSE}{n}}$
ここで:
- $q_{\alpha,k,df}$:スチューデント化レンジ分布の臨界値
- $k = 4$:群数
- $df = k(n-1) = 4 \times (5-1) = 16$:誤差の自由度
- $\alpha = 0.05$:有意水準
Step 3: スチューデント化レンジ分布の臨界値
$q_{0.05,4,16} = 4.05$(統計表より)
スチューデント化レンジ分布とは
$k$個の独立な正規分布から得られる標本の最大値と最小値の差を標準誤差で割った分布です。Tukey検定の理論的基礎となります。
Step 4: HSD値の計算
$HSD = 4.05 \times \sqrt{\frac{2.4}{5}}$
$HSD = 4.05 \times \sqrt{0.48}$
$HSD = 4.05 \times 0.693$
$HSD = 2.81$
小数第2位まで:2.81
Step 5: 全ての対比較の実施
平均値の差がHSD値を超える場合に有意差ありと判定:
| 比較 | 平均差 | |平均差| | 判定 |
|---|
| C vs A | 21.4 - 15.2 = 6.2 | 6.2 | 有意(6.2 > 2.81) |
| C vs D | 21.4 - 16.8 = 4.6 | 4.6 | 有意(4.6 > 2.81) |
| C vs B | 21.4 - 18.6 = 2.8 | 2.8 | 有意でない(2.8 < 2.81) |
| B vs A | 18.6 - 15.2 = 3.4 | 3.4 | 有意(3.4 > 2.81) |
| D vs A | 16.8 - 15.2 = 1.6 | 1.6 | 有意でない(1.6 < 2.81) |
| B vs D | 18.6 - 16.8 = 1.8 | 1.8 | 有意でない(1.8 < 2.81) |
結果の解釈
有意な差が認められる組み合わせ:
- C > A:処理Cは処理Aより有意に効果が高い
- C > D:処理Cは処理Dより有意に効果が高い
- B > A:処理Bは処理Aより有意に効果が高い
群の順位:C ≥ B ≥ D ≥ A
Step 6: 等質サブグループの特定
重複する群を持つ同質グループ:
- グループ1:A, D(互いに有意差なし)
- グループ2:B, C, D(B-CとB-Dが有意でない)
実際の研究での応用例
農業実験での解釈
4つの肥料処理の比較結果:
- 肥料C:最も効果的(21.4)
- 肥料B:2番目に効果的(18.6)
- 肥料D:中程度(16.8)
- 肥料A:最も効果が低い(15.2)
実用的推奨:肥料CとBが推奨される
他の多重比較法との比較
| 検定法 | 特徴 | 使用場面 |
|---|
| Tukey HSD | 全ての対比較、第1種過誤率制御 | 探索的分析、等サンプルサイズ |
| Bonferroni | より保守的、計画比較 | 少数の特定比較 |
| Scheffé | 最も保守的、すべての対比に対応 | 複雑な対比較 |
| Dunnett | 対照群との比較 | 1つの対照群vs複数処理群 |
Tukey検定の仮定
- 正規性:各群の残差が正規分布に従う
- 等分散性:各群の分散が等しい
- 独立性:観測値が互いに独立
- 事後比較:分散分析で有意差が確認済み