分散分析(ANOVA)と仮説検定
分散分析(Analysis of Variance, ANOVA)は、3つ以上のグループの平均値を比較するための統計的手法です。2つのグループの比較ではt検定が使われますが、3つ以上のグループを同時に比較する場合はANOVAが適しています。
一元配置ANOVA(One-way ANOVA)では、以下の仮説を検定します:
- 帰無仮説(H₀):すべてのグループの母平均は等しい(μ₁ = μ₂ = ... = μₖ)
- 対立仮説(H₁):少なくとも1つのグループの母平均は他と異なる
ANOVAの基本概念と考え方
ANOVAは、データの変動(分散)を2つの要素に分解して分析します:
- グループ間変動(Between-Group Variation):異なるグループの平均値の間の変動。これは処理効果(例:教育方法の違い)によって説明される変動部分です。
- グループ内変動(Within-Group Variation):各グループ内でのデータのばらつき。これは誤差(ランダムな変動)とみなされます。
ANOVAの基本的な考え方は、「もし処理効果(グループ間の差)が存在するなら、グループ間変動はグループ内変動より相対的に大きくなるはず」というものです。
平方和(Sum of Squares)の概念
ANOVAでは、変動の大きさを「平方和(Sum of Squares, SS)」として計算します:
- 全平方和(SST, Total Sum of Squares):すべてのデータが全体の平均からどれだけずれているかを二乗して合計したもの。全体のデータの変動の大きさを表します。
- グループ間平方和(SSB, Between-Group Sum of Squares):各グループの平均が全体の平均からどれだけずれているかを、各グループのサイズで重み付けし、二乗して合計したもの。グループ間の違いによる変動を表します。
- グループ内平方和(SSW, Within-Group Sum of Squares):各データが所属するグループの平均からどれだけずれているかを二乗して合計したもの。グループ内のランダムな変動(誤差)を表します。
これらの平方和には次の関係があります:
$SST = SSB + SSW$
平均平方(Mean Square)とF統計量
平方和をそれぞれの自由度で割ったものを「平均平方(Mean Square, MS)」と呼びます:
- グループ間平均平方(MSB):$MSB = \frac{SSB}{k-1}$(kはグループ数)
- グループ内平均平方(MSW):$MSW = \frac{SSW}{N-k}$(Nは全サンプル数)
F統計量は、MSBとMSWの比として計算されます:
$F = \frac{MSB}{MSW}$
F統計量が大きいほど、グループ間の差が誤差によるばらつきと比較して大きいことを示し、帰無仮説が棄却される可能性が高まります。
計算ステップ
問題で与えられた情報:
- グループ数:k = 3(教育方法A、B、C)
- 各グループのサンプルサイズ:n = 10
- 全サンプル数:N = 10 × 3 = 30
- グループ間平方和:SSB = 240
- グループ内平方和:SSW = 360
1. グループ間平均平方(MSB)の計算:
$MSB = \frac{SSB}{k-1} = \frac{240}{3-1} = \frac{240}{2} = 120$
2. グループ内平均平方(MSW)の計算:
$MSW = \frac{SSW}{N-k} = \frac{360}{30-3} = \frac{360}{27} ≈ 13.33$
3. F統計量の計算:
$F = \frac{MSB}{MSW} = \frac{120}{13.33} = 9.002$
結果の解釈
計算されたF統計量は 9.002 です。
このF値は、帰無仮説が真であるという前提の下で、自由度$(2, 27)$のF分布に従います。F値が大きいほど、帰無仮説(すべてのグループの平均が等しい)が棄却される可能性が高まります。
この仮説検定のp値を求めるには、計算されたF値と自由度$(2, 27)$のF分布の累積分布関数を使用します。一般に、F値が分布の上側5%(有意水準α = 0.05)または1%(α = 0.01)の臨界値を超える場合、帰無仮説は棄却されます。
重要ポイント:ANOVAの解釈と後続検定
- ANOVAの結果解釈:ANOVAで帰無仮説が棄却された場合、「少なくとも1つのグループの平均が他と異なる」と結論付けられますが、どのグループが異なるかまでは特定できません。
- 多重比較(Post-hoc tests):ANOVAで有意な結果が得られた後、どのグループ間に有意な差があるかを調べるために、Tukey法、Bonferroni法、Scheffé法などの多重比較検定を行います。
- 効果量:統計的有意性だけでなく、検出された差の実質的な大きさを評価するために、η²(イータ二乗)やω²(オメガ二乗)などの効果量も計算することが推奨されます。
- ANOVAの仮定:ANOVAを適用するには、各グループのデータが正規分布に従い、グループ間で分散が等しい(等分散性)という仮定が必要です。これらの仮定が満たされない場合、Kruskal-Wallisのノンパラメトリック検定など、代替手法の使用を検討すべきです。