中心極限定理、デルタ法、スルツキーの定理など統計検定準1級レベルの漸近理論を学習します。
問題はここに
最尤推定量は統計学における最も重要な推定手法の一つで、その漸近性質を理解することは統計的推論の基礎となります。特に大標本理論における漸近効率性と正規性は実用上極めて重要です。
漸近効率性:MLE は漸近的に最も効率的な推定量となります。漸近正規性:十分大きな標本で正規分布に従い、信頼区間構築が可能になります。
Step 1: MLE漸近理論の基本
正則条件下で、真のパラメータθ₀におけるMLE θ̂ₙは:
ここで I(θ₀) はフィッシャー情報量です。
フィッシャー情報量は以下のように定義されます:
性質 | 内容 | 意味 |
---|---|---|
非負性 | I(θ) ≥ 0 | 情報量は常に非負 |
加法性 | I_n(θ) = n·I(θ) | 独立標本では情報量が加算 |
不変性 | 変換に対する特別な性質 | パラメータ変換時の調整 |
Step 2: 正規分布のフィッシャー情報量計算
正規分布 N(μ, σ²) の対数尤度関数:
μに関する一次微分:
μに関する二次微分:
Step 3: フィッシャー情報量の計算
σ²が既知の場合のμに関するフィッシャー情報量:
本問では σ² = 16 なので:
n個の独立標本に対するフィッシャー情報量:
Step 4: MLE の漸近分散
Cramér-Rao下界により、μ̂の漸近分散は:
小数第3位まで:0.250
標本平均による直接計算:
Step 5: 一般的な正則条件
正規分布の場合、これらの条件はすべて満たされます。
Step 6: (μ, σ²) 両方が未知の場合
μとσ²が両方未知の場合のフィッシャー情報行列:
逆行列:
μ̂の漸近分散は第(1,1)成分:Var(μ̂) = σ²/n
状況 | μ̂の漸近分散 | 効率性 | 本例での値 |
---|---|---|---|
σ²既知 | σ²/n | 最高効率 | 16/64 = 0.25 |
σ²未知 | σ²/n | 同じ効率 | 16/64 = 0.25 |
興味深いことに、正規分布では μ と σ² の MLE は漸近的に独立であり、μ̂ の効率性は σ² が未知でも変わりません。
Step 7: 信頼区間の構築
μ̂ の漸近分布:
95%信頼区間:
もし標本平均が 10.3 だった場合:
Cramér-Rao下界により、任意の不偏推定量 T に対して:
MLE は漸近的にこの下界を達成するため「漸近効率的」と呼ばれます。
Step 8: 有限標本 vs 漸近的性質
性質 | 有限標本(n=64) | 漸近的(n→∞) | 近似の質 |
---|---|---|---|
分布 | 厳密に正規分布 | 漸近正規分布 | 完全一致 |
平均 | E[μ̂] = μ | μ | 完全一致 |
分散 | Var(μ̂) = σ²/n | σ²/n | 完全一致 |
効率性 | 最小分散不偏 | 漸近効率的 | 完全一致 |
正規分布では有限標本でも理論値が正確に成立する特別な例です。
分布 | MLEの形 | 漸近分散 | n=64での近似精度 |
---|---|---|---|
正規分布 | 標本平均 | σ²/n | 厳密 |
指数分布 | 1/標本平均 | λ²/n | 良好 |
ベルヌーイ | 標本比率 | p(1-p)/n | 良好 |
ポアソン | 標本平均 | λ/n | 良好 |
Step 9: モンテカルロシミュレーション
理論値の検証のための仮想実験結果:
シミュレーション回数 | μ̂の標本分散 | 理論値との差 | 標準誤差 |
---|---|---|---|
1,000回 | 0.248 | -0.002 | 0.498 |
10,000回 | 0.251 | +0.001 | 0.501 |
100,000回 | 0.250 | 0.000 | 0.500 |
シミュレーション結果が理論値 0.250 に収束することを確認できます。
Step 10: 実装における注意点
ソフトウェア | 関数 | 特徴 | 分散推定法 |
---|---|---|---|
R | maxLik(), optim() | 数値最適化 | 観測情報行列 |
Python | scipy.optimize | 柔軟性高 | 数値微分 |
SAS | PROC NLMIXED | 統合環境 | 自動計算 |
Stata | ml | 専用コマンド | 標準誤差自動 |
Step 11: Cramér-Rao下界の証明概要
任意の不偏推定量 T(X) に対して:
ここで ψ(θ) = E[T(X)] です。不偏推定量の場合 ψ(θ) = θ なので ψ'(θ) = 1 となり:
MLEは漸近的にこの下界を達成します。
この不等式は統計的推定の根本的限界を示しており、どんなに巧妙な推定法を考案しても、その分散はフィッシャー情報量の逆数以下にはできないことを意味します。
実際の研究報告例:
「正規分布 N(μ, 16) からの標本サイズ n=64 について、μ の最尤推定量の漸近分散を理論的に導出した。フィッシャー情報量 I(μ) = 1/16 により、μ̂ の漸近分散は 1/(64 × 1/16) = 0.250 と計算された。これは標本平均の理論分散 σ²/n = 16/64 = 0.250 と一致し、正規分布における MLE の効率性を確認している。」