極限・漸近理論

中心極限定理、デルタ法、スルツキーの定理など統計検定準1級レベルの漸近理論を学習します。

タイトルをここに レベル1

問題はここに

解説
解答と解説を表示

Wald統計量による仮説検定の理論と応用

Wald統計量は最尤推定量の漸近正規性を利用した検定統計量で、大標本仮説検定において広く使用されます。特に複雑なモデルでの線形・非線形制約の検定に威力を発揮します。

Wald検定の重要性

一般性:あらゆる尤度ベースのモデルに適用可能です。計算効率:制約下での最適化が不要で計算が簡単です。

Step 1: Wald統計量の基本理論

パラメータ θ に対する線形制約 H₀: Rθ = r の場合、Wald統計量は:

$$W = (R\hat{\theta} - r)'[R \hat{V}(\hat{\theta}) R']^{-1}(R\hat{\theta} - r)$$

帰無仮説下で W ~ χ²(q)(qは制約の数)に漸近的に従います。

単一パラメータの場合の簡略形

パラメータ θ₁つに対する仮説 H₀: θ = θ₀ の場合:

$$W = \frac{(\hat{\theta} - \theta_0)^2}{\hat{Var}(\hat{\theta})}$$
成分内容本例での値
θ̂最尤推定量p̂ = 0.6
θ₀帰無仮説値p₀ = 0.5
V̂ar(θ̂)推定量の推定分散p̂(1-p̂)/n

Step 2: ベルヌーイ分布でのMLE

ベルヌーイ分布 B(1, p) の場合:

  • 最尤推定量:p̂ = X̄ = 標本比率
  • 真の分散:Var(p̂) = p(1-p)/n
  • 推定分散:V̂ar(p̂) = p̂(1-p̂)/n

本問では:

  • n = 400
  • p̂ = 0.6
  • 推定分散:V̂ar(p̂) = 0.6 × 0.4 / 400 = 0.24 / 400 = 0.0006

Step 3: Wald統計量の計算

帰無仮説 H₀: p = 0.5 に対するWald統計量(標準化された形式):

$$W = \frac{\hat{p} - p_0}{\sqrt{\hat{Var}(\hat{p})}} = \frac{0.6 - 0.5}{\sqrt{0.0006}}$$
$$= \frac{0.1}{\sqrt{0.0006}} = \frac{0.1}{0.02449} = 4.08$$

小数第2位まで:4.08

計算の検証

別の方法での確認:

  • 標準化統計量:Z = (p̂ - p₀)/√[p̂(1-p̂)/n]
  • 計算:Z = (0.6 - 0.5)/√0.0006 = 0.1/√0.0006
  • 分母:√0.0006 = √(6×10⁻⁴) ≈ 0.02449
  • Z値:0.1/0.02449 ≈ 4.08
  • Wald統計量:W = Z ≈ 4.08

Wald検定の性質と特徴

Step 4: 他の検定統計量との比較

三大仮説検定手法の比較

検定手法統計量計算コスト精度
Wald検定(θ̂-θ₀)²/V̂ar(θ̂)良好
尤度比検定2[ℓ(θ̂)-ℓ(θ₀)]最良
スコア検定S²(θ₀)/I(θ₀)良好

Wald検定は計算が最も簡単で、制約下での最適化が不要です。

帰無仮説下での分散の選択

Step 5: 分散推定法の選択肢

Wald統計量では分散の推定に複数の選択肢があります:

方法分散推定本例での値特徴
MLEベースp̂(1-p̂)/n0.0006一般的
帰無仮説ベースp₀(1-p₀)/n0.000625保守的
サンドイッチ推定頑健な分散推定状況依存頑健性重視

一般的にはMLE ベースの分散(p̂(1-p̂)/n)を使用します。

帰無仮説ベースの場合の計算

参考として、p₀ = 0.5 での分散を使った場合:

$$W_{H_0} = \frac{(0.6 - 0.5)^2}{0.5 \times 0.5 / 400} = \frac{0.01}{0.000625} = 16$$

若干異なる値になりますが、大標本では両者はほぼ同じ結果を与えます。

検定の実行と判定

Step 6: 臨界値との比較

Wald統計量 W = 4.08 は標準正規分布に従います:

有意水準臨界値判定p値
5%1.96棄却<0.001
1%2.58棄却<0.001
0.1%3.29棄却<0.001

W = 4.08 > 3.29 なので、0.1% 水準でも帰無仮説を棄却します。

Z検定との関係

単一パラメータの場合、Wald統計量はZ統計量の二乗:

$$Z = \frac{\hat{p} - p_0}{\sqrt{\hat{Var}(\hat{p})}} = \frac{0.1}{\sqrt{0.0006}} \approx 4.08$$

両側検定のp値:P(|Z| > 4.08) ≈ 0.000045

実際の応用例

Step 7: ビジネス・研究での活用

Wald検定の実用例

  • A/Bテスト:コンバージョン率の差の検定
  • 品質管理:不良率が基準値を超えているかの検定
  • 医学研究:治療効果の有意性検定
  • 市場調査:支持率・満足度の変化検定

多変量への拡張

Step 8: 複数制約の同時検定

k個のパラメータ θ = (θ₁, ..., θₖ)' に対する q個の線形制約:

$$H_0: R\theta = r$$

ここで R は q×k 行列、r は q×1 ベクトル。

Wald統計量:

$$W = (R\hat{\theta} - r)'[R \hat{V}(\hat{\theta}) R']^{-1}(R\hat{\theta} - r) \sim \chi^2(q)$$

回帰分析での例

線形回帰 y = β₀ + β₁x₁ + β₂x₂ + ε で:

  • H₀: β₁ = β₂ = 0 (全体の有意性)
  • H₀: β₁ = β₂ (係数の等しさ)
  • H₀: β₁ + β₂ = 1 (線形結合の値)

これらすべてがWald検定で検定できます。

漸近理論の背景

Step 9: 理論的基礎

Wald統計量の漸近理論は以下に基づきます:

$$\sqrt{n}(\hat{\theta} - \theta_0) \xrightarrow{d} N(0, I^{-1}(\theta_0))$$

線形変換 √n R(θ̂ - θ₀) も漸近正規分布に従い:

$$\sqrt{n} R(\hat{\theta} - \theta_0) \xrightarrow{d} N(0, R I^{-1}(\theta_0) R')$$

したがって、二次形式 W は χ² 分布に収束します。

収束速度と精度

標本サイズ近似精度推奨用途
n < 30精度低使用非推奨
30 ≤ n < 100やや粗い注意して使用
n ≥ 100良好一般的使用
n ≥ 400高精度十分信頼できる

本例の n = 400 は十分大きく、漸近近似が良く働きます。

統計ソフトでの実装

Step 10: 主要ソフトでの実行

ソフトウェア別実装

ソフトウェア関数・コマンド特徴
Rwaldtest(), linearHypothesis()豊富なオプション
Pythonstatsmodels.stats.wald柔軟な制約指定
SASTEST文自動計算
Statatest簡潔な構文

検定力と標本サイズ設計

Step 11: 検定力計算

対立仮説 H₁: p = p₁ に対する検定力:

$$\text{Power} = P(W > \chi^2_{\alpha}(1) | p = p_1)$$

本例で p₁ = 0.6 の場合の検定力は約 99.9% となり、十分高い検出能力を持ちます。

必要標本サイズの設計

効果サイズ δ = |p₁ - p₀| に対して、検定力 1-β を得るために必要なサンプルサイズ:

$$n \approx \frac{(z_{\alpha/2} + z_\beta)^2 p_0(1-p_0)}{\delta^2}$$

本例では δ = 0.1、α = 0.05、β = 0.2(検定力80%)の場合:

n ≈ 96 程度で十分なところ、n = 400 は非常に余裕のある設計です。

注意点と限界

Wald検定の注意点

  1. パラメータ変換への敏感性:非線形変換で結果が変わる場合
  2. 境界近くでの精度低下:p ≈ 0 や p ≈ 1 での近似精度
  3. 分散推定の不安定性:極端な推定値での問題
  4. サンプルサイズ依存:小標本での近似の粗さ

計算の完全な検証

Step 12: 最終確認

ステップ計算結果
標本比率観測値p̂ = 0.6
推定分散0.6×0.4/4000.0006
標準偏差√0.00060.02449
Wald統計量0.1/0.024494.08
判定W > 1.96H₀棄却

結果の解釈と報告

実際の研究報告例:

「ベルヌーイ分布 B(1, p) からの標本サイズ n=400 で観測された標本比率 p̂=0.6 について、H₀: p=0.5 に対するWald検定を実施した。検定統計量 W = (0.6-0.5)/√[0.6×0.4/400] = 4.08 は標準正規分布の 0.1% 臨界値 3.29 を上回り、p < 0.001 で帰無仮説を強く棄却する。母比率は 0.5 と有意に異なると結論される。」

問題 1/10