ウィルコクソンの順位和検定
分布の形に関する仮定を置かない非パラメトリック検定により、2つの独立標本の位置の差を検定する方法について説明します。
ウィルコクソンの順位和検定の理論的基礎
Step 1: 検定の前提条件
ウィルコクソンの順位和検定(マン・ホイットニーのU検定)の仮定:
- 独立性:2つの標本は独立に抽出される
- 順序性:観測値は順序づけ可能
- 連続性:同順位(タイ)がない(または少ない)
Step 2: 帰無仮説と対立仮説
検定仮説:
$H_0: \text{2つの分布が同一} \quad \text{vs} \quad H_1: \text{分布に位置の違いがある}$
より厳密には:
$H_0: P(X_1 > X_2) = 0.5 \quad \text{vs} \quad H_1: P(X_1 > X_2) \neq 0.5$
順位付けと順位和の計算
Step 3: データの整理
与えられた観測値:
- 標本1:$x_1 = 12, 15, 18, 21$ ($n_1 = 4$)
- 標本2:$x_2 = 14, 16, 19, 22, 25$ ($n_2 = 5$)
- 総標本サイズ:$N = n_1 + n_2 = 9$
Step 4: 統合順位付け
全観測値を昇順に並べ、順位を付与:
| 観測値 | 12 | 14 | 15 | 16 | 18 | 19 | 21 | 22 | 25 |
|---|
| 順位 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
| 標本 | 1 | 2 | 1 | 2 | 1 | 2 | 1 | 2 | 2 |
Step 5: 標本1の順位和$R_1$の計算
標本1の観測値とその順位:
- $x_1 = 12$:順位 1
- $x_1 = 15$:順位 3
- $x_1 = 18$:順位 5
- $x_1 = 21$:順位 7
標本1の順位和:
$R_1 = 1 + 3 + 5 + 7 = 16$
検算のため標本2の順位和:
$R_2 = 2 + 4 + 6 + 8 + 9 = 29$
総順位和の確認:
$R_1 + R_2 = 16 + 29 = 45 = \frac{N(N+1)}{2} = \frac{9 \times 10}{2} = 45$ ✓
ウィルコクソンの順位和検定の特徴
- 分布フリー:母集団の分布に依存しない
- 頑健性:外れ値に対して頑健
- 効率性:正規分布でも高い相対効率(95%)
- 適用範囲:順序尺度データにも適用可能
- 直感性:順位に基づく明確な論理
検定統計量の計算と分布
Step 6: ウィルコクソンのW統計量
ウィルコクソンのW統計量は、小さい方の標本の順位和:
$W = \min(R_1, R_2) = \min(16, 29) = 16$
Step 7: マン・ホイットニーのU統計量
マン・ホイットニーのU統計量:
$U_1 = R_1 - \frac{n_1(n_1+1)}{2} = 16 - \frac{4 \times 5}{2} = 16 - 10 = 6$
$U_2 = R_2 - \frac{n_2(n_2+1)}{2} = 29 - \frac{5 \times 6}{2} = 29 - 15 = 14$
確認:$U_1 + U_2 = 6 + 14 = 20 = n_1 \times n_2 = 4 \times 5$ ✓
統計量の分布と正規近似
Step 8: 正確分布(小標本)
小標本の場合、順位和$R_1$の分布は組み合わせ論的に導出可能:
$P(R_1 = r) = \frac{\binom{N}{n_1}から順位和がrとなる組み合わせ数}{\binom{N}{n_1}}$
Step 9: 正規近似(大標本)
大標本の場合、順位和$R_1$は近似的に正規分布に従う:
$E[R_1] = \frac{n_1(N+1)}{2} = \frac{4 \times 10}{2} = 20$
$\text{Var}(R_1) = \frac{n_1 n_2 (N+1)}{12} = \frac{4 \times 5 \times 10}{12} = \frac{200}{12} = 16.67$
標準化統計量:
$Z = \frac{R_1 - E[R_1]}{\sqrt{\text{Var}(R_1)}} = \frac{16 - 20}{\sqrt{16.67}} = \frac{-4}{4.08} = -0.98$