Wald統計量による仮説検定の理論と応用
Wald統計量は最尤推定量の漸近正規性を利用した検定統計量で、大標本仮説検定において広く使用されます。特に複雑なモデルでの線形・非線形制約の検定に威力を発揮します。
Wald検定の重要性
一般性:あらゆる尤度ベースのモデルに適用可能です。計算効率:制約下での最適化が不要で計算が簡単です。
Step 1: Wald統計量の基本理論
パラメータ θ に対する線形制約 H₀: Rθ = r の場合、Wald統計量は:
$W = (R\hat{\theta} - r)'[R \hat{V}(\hat{\theta}) R']^{-1}(R\hat{\theta} - r)$
帰無仮説下で W ~ χ²(q)(qは制約の数)に漸近的に従います。
単一パラメータの場合の簡略形
パラメータ θ₁つに対する仮説 H₀: θ = θ₀ の場合:
$W = \frac{(\hat{\theta} - \theta_0)^2}{\hat{Var}(\hat{\theta})}$
| 成分 | 内容 | 本例での値 |
|---|
| θ̂ | 最尤推定量 | p̂ = 0.6 |
| θ₀ | 帰無仮説値 | p₀ = 0.5 |
| V̂ar(θ̂) | 推定量の推定分散 | p̂(1-p̂)/n |
Step 2: ベルヌーイ分布でのMLE
ベルヌーイ分布 B(1, p) の場合:
- 最尤推定量:p̂ = X̄ = 標本比率
- 真の分散:Var(p̂) = p(1-p)/n
- 推定分散:V̂ar(p̂) = p̂(1-p̂)/n
本問では:
- n = 400
- p̂ = 0.6
- 推定分散:V̂ar(p̂) = 0.6 × 0.4 / 400 = 0.24 / 400 = 0.0006
Step 3: Wald統計量の計算
帰無仮説 H₀: p = 0.5 に対するWald統計量(標準化された形式):
$W = \frac{\hat{p} - p_0}{\sqrt{\hat{Var}(\hat{p})}} = \frac{0.6 - 0.5}{\sqrt{0.0006}}$
$= \frac{0.1}{\sqrt{0.0006}} = \frac{0.1}{0.02449} = 4.08$
小数第2位まで:4.08
計算の検証
別の方法での確認:
- 標準化統計量:Z = (p̂ - p₀)/√[p̂(1-p̂)/n]
- 計算:Z = (0.6 - 0.5)/√0.0006 = 0.1/√0.0006
- 分母:√0.0006 = √(6×10⁻⁴) ≈ 0.02449
- Z値:0.1/0.02449 ≈ 4.08
- Wald統計量:W = Z ≈ 4.08
Wald検定の性質と特徴
Step 4: 他の検定統計量との比較
三大仮説検定手法の比較
| 検定手法 | 統計量 | 計算コスト | 精度 |
|---|
| Wald検定 | (θ̂-θ₀)²/V̂ar(θ̂) | 低 | 良好 |
| 尤度比検定 | 2[ℓ(θ̂)-ℓ(θ₀)] | 中 | 最良 |
| スコア検定 | S²(θ₀)/I(θ₀) | 低 | 良好 |
Wald検定は計算が最も簡単で、制約下での最適化が不要です。
帰無仮説下での分散の選択
Step 5: 分散推定法の選択肢
Wald統計量では分散の推定に複数の選択肢があります:
| 方法 | 分散推定 | 本例での値 | 特徴 |
|---|
| MLEベース | p̂(1-p̂)/n | 0.0006 | 一般的 |
| 帰無仮説ベース | p₀(1-p₀)/n | 0.000625 | 保守的 |
| サンドイッチ推定 | 頑健な分散推定 | 状況依存 | 頑健性重視 |
一般的にはMLE ベースの分散(p̂(1-p̂)/n)を使用します。
帰無仮説ベースの場合の計算
参考として、p₀ = 0.5 での分散を使った場合:
$W_{H_0} = \frac{(0.6 - 0.5)^2}{0.5 \times 0.5 / 400} = \frac{0.01}{0.000625} = 16$
若干異なる値になりますが、大標本では両者はほぼ同じ結果を与えます。
検定の実行と判定
Step 6: 臨界値との比較
Wald統計量 W = 4.08 は標準正規分布に従います:
| 有意水準 | 臨界値 | 判定 | p値 |
|---|
| 5% | 1.96 | 棄却 | <0.001 |
| 1% | 2.58 | 棄却 | <0.001 |
| 0.1% | 3.29 | 棄却 | <0.001 |
W = 4.08 > 3.29 なので、0.1% 水準でも帰無仮説を棄却します。
Z検定との関係
単一パラメータの場合、Wald統計量はZ統計量の二乗:
$Z = \frac{\hat{p} - p_0}{\sqrt{\hat{Var}(\hat{p})}} = \frac{0.1}{\sqrt{0.0006}} \approx 4.08$
両側検定のp値:P(|Z| > 4.08) ≈ 0.000045
実際の応用例
Step 7: ビジネス・研究での活用
Wald検定の実用例
- A/Bテスト:コンバージョン率の差の検定
- 品質管理:不良率が基準値を超えているかの検定
- 医学研究:治療効果の有意性検定
- 市場調査:支持率・満足度の変化検定
多変量への拡張
Step 8: 複数制約の同時検定
k個のパラメータ θ = (θ₁, ..., θₖ)' に対する q個の線形制約:
$H_0: R\theta = r$
ここで R は q×k 行列、r は q×1 ベクトル。
Wald統計量:
$W = (R\hat{\theta} - r)'[R \hat{V}(\hat{\theta}) R']^{-1}(R\hat{\theta} - r) \sim \chi^2(q)$
回帰分析での例
線形回帰 y = β₀ + β₁x₁ + β₂x₂ + ε で:
- H₀: β₁ = β₂ = 0 (全体の有意性)
- H₀: β₁ = β₂ (係数の等しさ)
- H₀: β₁ + β₂ = 1 (線形結合の値)
これらすべてがWald検定で検定できます。
漸近理論の背景
Step 9: 理論的基礎
Wald統計量の漸近理論は以下に基づきます:
$\sqrt{n}(\hat{\theta} - \theta_0) \xrightarrow{d} N(0, I^{-1}(\theta_0))$
線形変換 √n R(θ̂ - θ₀) も漸近正規分布に従い:
$\sqrt{n} R(\hat{\theta} - \theta_0) \xrightarrow{d} N(0, R I^{-1}(\theta_0) R')$
したがって、二次形式 W は χ² 分布に収束します。
収束速度と精度
| 標本サイズ | 近似精度 | 推奨用途 |
|---|
| n < 30 | 精度低 | 使用非推奨 |
| 30 ≤ n < 100 | やや粗い | 注意して使用 |
| n ≥ 100 | 良好 | 一般的使用 |
| n ≥ 400 | 高精度 | 十分信頼できる |
本例の n = 400 は十分大きく、漸近近似が良く働きます。
統計ソフトでの実装
Step 10: 主要ソフトでの実行
ソフトウェア別実装
| ソフトウェア | 関数・コマンド | 特徴 |
|---|
| R | waldtest(), linearHypothesis() | 豊富なオプション |
| Python | statsmodels.stats.wald | 柔軟な制約指定 |
| SAS | TEST文 | 自動計算 |
| Stata | test | 簡潔な構文 |
検定力と標本サイズ設計
Step 11: 検定力計算
対立仮説 H₁: p = p₁ に対する検定力:
$\text{Power} = P(W > \chi^2_{\alpha}(1) | p = p_1)$
本例で p₁ = 0.6 の場合の検定力は約 99.9% となり、十分高い検出能力を持ちます。
必要標本サイズの設計
効果サイズ δ = |p₁ - p₀| に対して、検定力 1-β を得るために必要なサンプルサイズ:
$n \approx \frac{(z_{\alpha/2} + z_\beta)^2 p_0(1-p_0)}{\delta^2}$
本例では δ = 0.1、α = 0.05、β = 0.2(検定力80%)の場合:
n ≈ 96 程度で十分なところ、n = 400 は非常に余裕のある設計です。
注意点と限界
Wald検定の注意点
- パラメータ変換への敏感性:非線形変換で結果が変わる場合
- 境界近くでの精度低下:p ≈ 0 や p ≈ 1 での近似精度
- 分散推定の不安定性:極端な推定値での問題
- サンプルサイズ依存:小標本での近似の粗さ
計算の完全な検証
Step 12: 最終確認
| ステップ | 計算 | 結果 |
|---|
| 標本比率 | 観測値 | p̂ = 0.6 |
| 推定分散 | 0.6×0.4/400 | 0.0006 |
| 標準偏差 | √0.0006 | 0.02449 |
| Wald統計量 | 0.1/0.02449 | 4.08 |
| 判定 | W > 1.96 | H₀棄却 |
結果の解釈と報告
実際の研究報告例:
「ベルヌーイ分布 B(1, p) からの標本サイズ n=400 で観測された標本比率 p̂=0.6 について、H₀: p=0.5 に対するWald検定を実施した。検定統計量 W = (0.6-0.5)/√[0.6×0.4/400] = 4.08 は標準正規分布の 0.1% 臨界値 3.29 を上回り、p < 0.001 で帰無仮説を強く棄却する。母比率は 0.5 と有意に異なると結論される。」