一元配置分散分析の基本計算
一元配置分散分析(One-way ANOVA)は、3つ以上の群の平均値に差があるかを検定する統計手法です。処理間平方和(SSB)は、群間の変動を表す重要な指標です。
分散分析の基本概念
全変動の分解:総変動=処理間変動+処理内変動として分解できます。F検定:処理間変動と処理内変動の比を用いて群間差を検定します。
Step 1: 各群の記述統計量を計算
| 群 | データ | 群平均(x̄ᵢ) | サンプルサイズ(nᵢ) |
|---|
| A | 8, 12, 10, 14 | 11.0 | 4 |
| B | 15, 13, 17, 11 | 14.0 | 4 |
| C | 6, 8, 10, 4 | 7.0 | 4 |
各群平均の計算:
$\bar{x}_A = \frac{8+12+10+14}{4} = \frac{44}{4} = 11.0$
$\bar{x}_B = \frac{15+13+17+11}{4} = \frac{56}{4} = 14.0$
$\bar{x}_C = \frac{6+8+10+4}{4} = \frac{28}{4} = 7.0$
Step 2: 全体平均(総平均)を計算
全データ:8, 12, 10, 14, 15, 13, 17, 11, 6, 8, 10, 4
総サンプル数:N = 4 + 4 + 4 = 12
$\bar{x}_{全体} = \frac{\sum_{i=1}^{k}\sum_{j=1}^{n_i} x_{ij}}{N} = \frac{44+56+28}{12} = \frac{128}{12} = 10.67$
Step 3: 処理間平方和(SSB)の計算
処理間平方和の公式:
$SSB = \sum_{i=1}^{k} n_i(\bar{x}_i - \bar{x}_{全体})^2$
各群の寄与を計算:
群Aの寄与:
$n_A(\bar{x}_A - \bar{x}_{全体})^2 = 4 \times (11.0 - 10.67)^2 = 4 \times (0.33)^2 = 4 \times 0.109 = 0.436$
群Bの寄与:
$n_B(\bar{x}_B - \bar{x}_{全体})^2 = 4 \times (14.0 - 10.67)^2 = 4 \times (3.33)^2 = 4 \times 11.089 = 44.356$
群Cの寄与:
$n_C(\bar{x}_C - \bar{x}_{全体})^2 = 4 \times (7.0 - 10.67)^2 = 4 \times (-3.67)^2 = 4 \times 13.469 = 53.876$
Step 4: SSBの合計
より正確な計算:
$\bar{x}_{全体} = \frac{128}{12} = 10\frac{2}{3}$
$SSB = 4(11 - 10\frac{2}{3})^2 + 4(14 - 10\frac{2}{3})^2 + 4(7 - 10\frac{2}{3})^2$
$= 4(\frac{1}{3})^2 + 4(\frac{10}{3})^2 + 4(-\frac{11}{3})^2$
$= 4 \times \frac{1}{9} + 4 \times \frac{100}{9} + 4 \times \frac{121}{9}$
$= \frac{4}{9} + \frac{400}{9} + \frac{484}{9} = \frac{888}{9} = \frac{296}{3} = 98.67$
処理間平方和の意味
| 項目 | 値 | 解釈 |
|---|
| 群A平均 | 11.0 | 全体平均より少し高い |
| 群B平均 | 14.0 | 全体平均より大幅に高い |
| 群C平均 | 7.0 | 全体平均より大幅に低い |
| SSB | 84 | 群間変動の大きさ |
Step 5: 分散分析表の構成要素
| 変動要因 | 平方和 | 自由度 | 平均平方 | F値 |
|---|
| 処理間(Between) | SSB = 84 | k-1 = 2 | MSB = 42 | F計算要 |
| 処理内(Within) | SSW | N-k = 9 | MSW | - |
| 全体 | SST | N-1 = 11 | - | - |
分散分析の基本式
- 総変動の分解:SST = SSB + SSW
- F統計量:F = MSB/MSW
- 自由度:処理間 df = k-1、処理内 df = N-k
- 平均平方:MS = SS/df