漸近理論問題5 - 青の統計学-DS Playground-

タイトルをここにレベル1

問題はここに

解説

解答と解説を表示

Wald統計量による仮説検定の理論と応用

Wald統計量は最尤推定量の漸近正規性を利用した検定統計量で、大標本仮説検定において広く使用されます。特に複雑なモデルでの線形・非線形制約の検定に威力を発揮します。

Wald検定の重要性

一般性：あらゆる尤度ベースのモデルに適用可能です。計算効率：制約下での最適化が不要で計算が簡単です。

Step 1: Wald統計量の基本理論

パラメータ θ に対する線形制約 H₀: Rθ = r の場合、Wald統計量は：

$$W = (R\hat{\theta} - r)'[R \hat{V}(\hat{\theta}) R']^{-1}(R\hat{\theta} - r)$$

帰無仮説下で W ~ χ²(q)（qは制約の数）に漸近的に従います。

単一パラメータの場合の簡略形

パラメータ θ₁つに対する仮説 H₀: θ = θ₀ の場合：

$$W = \frac{(\hat{\theta} - \theta_0)^2}{\hat{Var}(\hat{\theta})}$$

成分	内容	本例での値
θ̂	最尤推定量	p̂ = 0.6
θ₀	帰無仮説値	p₀ = 0.5
V̂ar(θ̂)	推定量の推定分散	p̂(1-p̂)/n

Step 2: ベルヌーイ分布でのMLE

ベルヌーイ分布 B(1, p) の場合：

最尤推定量：p̂ = X̄ = 標本比率
真の分散：Var(p̂) = p(1-p)/n
推定分散：V̂ar(p̂) = p̂(1-p̂)/n

本問では：

n = 400
p̂ = 0.6
推定分散：V̂ar(p̂) = 0.6 × 0.4 / 400 = 0.24 / 400 = 0.0006

Step 3: Wald統計量の計算

帰無仮説 H₀: p = 0.5 に対するWald統計量（標準化された形式）：

$$W = \frac{\hat{p} - p_0}{\sqrt{\hat{Var}(\hat{p})}} = \frac{0.6 - 0.5}{\sqrt{0.0006}}$$

$$= \frac{0.1}{\sqrt{0.0006}} = \frac{0.1}{0.02449} = 4.08$$

小数第2位まで：4.08

計算の検証

別の方法での確認：

標準化統計量：Z = (p̂ - p₀)/√[p̂(1-p̂)/n]
計算：Z = (0.6 - 0.5)/√0.0006 = 0.1/√0.0006
分母：√0.0006 = √(6×10⁻⁴) ≈ 0.02449
Z値：0.1/0.02449 ≈ 4.08
Wald統計量：W = Z ≈ 4.08

Wald検定の性質と特徴

Step 4: 他の検定統計量との比較

三大仮説検定手法の比較

検定手法	統計量	計算コスト	精度
Wald検定	(θ̂-θ₀)²/V̂ar(θ̂)	低	良好
尤度比検定	2[ℓ(θ̂)-ℓ(θ₀)]	中	最良
スコア検定	S²(θ₀)/I(θ₀)	低	良好

Wald検定は計算が最も簡単で、制約下での最適化が不要です。

帰無仮説下での分散の選択

Step 5: 分散推定法の選択肢

Wald統計量では分散の推定に複数の選択肢があります：

方法	分散推定	本例での値	特徴
MLEベース	p̂(1-p̂)/n	0.0006	一般的
帰無仮説ベース	p₀(1-p₀)/n	0.000625	保守的
サンドイッチ推定	頑健な分散推定	状況依存	頑健性重視

一般的にはMLE ベースの分散（p̂(1-p̂)/n）を使用します。

帰無仮説ベースの場合の計算

参考として、p₀ = 0.5 での分散を使った場合：

$$W_{H_0} = \frac{(0.6 - 0.5)^2}{0.5 \times 0.5 / 400} = \frac{0.01}{0.000625} = 16$$

若干異なる値になりますが、大標本では両者はほぼ同じ結果を与えます。

検定の実行と判定

Step 6: 臨界値との比較

Wald統計量 W = 4.08 は標準正規分布に従います：

有意水準	臨界値	判定	p値
5%	1.96	棄却	<0.001
1%	2.58	棄却	<0.001
0.1%	3.29	棄却	<0.001

W = 4.08 > 3.29 なので、0.1% 水準でも帰無仮説を棄却します。

Z検定との関係

単一パラメータの場合、Wald統計量はZ統計量の二乗：

$$Z = \frac{\hat{p} - p_0}{\sqrt{\hat{Var}(\hat{p})}} = \frac{0.1}{\sqrt{0.0006}} \approx 4.08$$

両側検定のp値：P(|Z| > 4.08) ≈ 0.000045

実際の応用例

Step 7: ビジネス・研究での活用

Wald検定の実用例

A/Bテスト：コンバージョン率の差の検定
品質管理：不良率が基準値を超えているかの検定
医学研究：治療効果の有意性検定
市場調査：支持率・満足度の変化検定

多変量への拡張

Step 8: 複数制約の同時検定

k個のパラメータ θ = (θ₁, ..., θₖ)' に対する q個の線形制約：

$$H_0: R\theta = r$$

ここで R は q×k 行列、r は q×1 ベクトル。

Wald統計量：

$$W = (R\hat{\theta} - r)'[R \hat{V}(\hat{\theta}) R']^{-1}(R\hat{\theta} - r) \sim \chi^2(q)$$

回帰分析での例

線形回帰 y = β₀ + β₁x₁ + β₂x₂ + ε で：

H₀: β₁ = β₂ = 0 （全体の有意性）
H₀: β₁ = β₂ （係数の等しさ）
H₀: β₁ + β₂ = 1 （線形結合の値）

これらすべてがWald検定で検定できます。

漸近理論の背景

Step 9: 理論的基礎

Wald統計量の漸近理論は以下に基づきます：

$$\sqrt{n}(\hat{\theta} - \theta_0) \xrightarrow{d} N(0, I^{-1}(\theta_0))$$

線形変換 √n R(θ̂ - θ₀) も漸近正規分布に従い：

$$\sqrt{n} R(\hat{\theta} - \theta_0) \xrightarrow{d} N(0, R I^{-1}(\theta_0) R')$$

したがって、二次形式 W は χ² 分布に収束します。

収束速度と精度

標本サイズ	近似精度	推奨用途
n < 30	精度低	使用非推奨
30 ≤ n < 100	やや粗い	注意して使用
n ≥ 100	良好	一般的使用
n ≥ 400	高精度	十分信頼できる

本例の n = 400 は十分大きく、漸近近似が良く働きます。

統計ソフトでの実装

Step 10: 主要ソフトでの実行

ソフトウェア別実装

ソフトウェア	関数・コマンド	特徴
R	waldtest(), linearHypothesis()	豊富なオプション
Python	statsmodels.stats.wald	柔軟な制約指定
SAS	TEST文	自動計算
Stata	test	簡潔な構文

検定力と標本サイズ設計

Step 11: 検定力計算

対立仮説 H₁: p = p₁ に対する検定力：

$$\text{Power} = P(W > \chi^2_{\alpha}(1) | p = p_1)$$

本例で p₁ = 0.6 の場合の検定力は約 99.9% となり、十分高い検出能力を持ちます。

必要標本サイズの設計

効果サイズ δ = |p₁ - p₀| に対して、検定力 1-β を得るために必要なサンプルサイズ：

$$n \approx \frac{(z_{\alpha/2} + z_\beta)^2 p_0(1-p_0)}{\delta^2}$$

本例では δ = 0.1、α = 0.05、β = 0.2（検定力80%）の場合：

n ≈ 96 程度で十分なところ、n = 400 は非常に余裕のある設計です。

注意点と限界

Wald検定の注意点

パラメータ変換への敏感性：非線形変換で結果が変わる場合
境界近くでの精度低下：p ≈ 0 や p ≈ 1 での近似精度
分散推定の不安定性：極端な推定値での問題
サンプルサイズ依存：小標本での近似の粗さ

計算の完全な検証

Step 12: 最終確認

ステップ	計算	結果
標本比率	観測値	p̂ = 0.6
推定分散	0.6×0.4/400	0.0006
標準偏差	√0.0006	0.02449
Wald統計量	0.1/0.02449	4.08
判定	W > 1.96	H₀棄却

結果の解釈と報告

実際の研究報告例：

「ベルヌーイ分布 B(1, p) からの標本サイズ n=400 で観測された標本比率 p̂=0.6 について、H₀: p=0.5 に対するWald検定を実施した。検定統計量 W = (0.6-0.5)/√[0.6×0.4/400] = 4.08 は標準正規分布の 0.1% 臨界値 3.29 を上回り、p < 0.001 で帰無仮説を強く棄却する。母比率は 0.5 と有意に異なると結論される。」

極限・漸近理論