中心極限定理、デルタ法、スルツキーの定理など統計検定準1級レベルの漸近理論を学習します。
問題はここに
漸近効率性は推定量の優劣を判定する最も重要な基準の一つです。効率的な推定量は与えられた情報から最大限の精度を引き出し、実用上極めて価値があります。
統計的精度:同じデータからより正確な推定を得られます。経済性:少ないサンプルサイズで同等の精度を達成できます。
Step 1: 効率性の定義
2つの不偏推定量 T₁, T₂ に対する相対効率性:
この値が1に近いほど T₂ は T₁ と同程度に効率的です。
任意の不偏推定量 T に対して:
ここで I(θ) はフィッシャー情報量です。この下界を達成する推定量が「効率的」と呼ばれます。
推定量 | 特徴 | 効率性 |
---|---|---|
効率的推定量 | 下界を達成 | 最高 |
MLE(正則条件下) | 漸近効率的 | 漸近最高 |
UMVUE | 最小分散不偏 | 有限標本最高 |
Step 2: 各推定量の分散計算
正規分布 N(μ, σ²=4) に対して:
T₁ = X̄ の分散:
T₂ = (X₁ + X₂)/2 の分散:
Step 3: 相対効率性の計算
小数第3位まで:0.020
T₂ の効率性は T₁ のわずか 2% です。これは:
Step 4: フィッシャー情報量による分析
正規分布 N(μ, σ²=4) でのフィッシャー情報量:
n個の独立標本での情報量:
Cramér-Rao下界:
T₁ はこの下界を達成しているため効率的です。
推定量 | 分散 | 下界比 | 効率性 |
---|---|---|---|
T₁ = X̄ | 0.04 | 0.04/0.04 = 1 | 100% |
T₂ = (X₁+X₂)/2 | 2.0 | 0.04/2.0 = 0.02 | 2% |
X₁ のみ | 4.0 | 0.04/4.0 = 0.01 | 1% |
Step 5: 漸近相対効率性
一般に、2つの推定量 Tₙ⁽¹⁾, Tₙ⁽²⁾ の漸近相対効率性(ARE)は:
本例では:
T₂ は漸近的に完全に非効率になります。
効率性 0.02 の意味:
Step 6: 様々な推定量の効率性
推定量 | 定義 | 分散 | 効率性 |
---|---|---|---|
標本平均 | X̄ | σ²/n = 0.04 | 100% |
標本中央値 | Median | πσ²/(2n) ≈ 0.063 | 63.7% |
切断平均 | 5%切断 | 約 1.25σ²/n ≈ 0.05 | 80% |
部分平均 | (X₁+...+Xₖ)/k | σ²/k | k/n × 100% |
効率性が最高でない推定量にも利点があります:
Step 7: 数値例による確認
真の値 μ = 10, σ² = 4 でのシミュレーション結果(10,000回):
推定量 | 理論分散 | 実験分散 | 理論効率性 | 実験効率性 |
---|---|---|---|---|
T₁ | 0.040 | 0.0398 | 100% | 100% |
T₂ | 2.000 | 2.003 | 2.0% | 1.99% |
理論値と実験値がよく一致しています。
効率性 2% は以下を意味します:
T₂ で T₁ と同じ精度を得るには50倍のサンプルが必要です。
Step 8: Gauss-Markovの定理
線形不偏推定量の中で標本平均が最小分散を持つことは Gauss-Markov の定理で保証されています:
この中で Var(T) を最小化するのは aᵢ = 1/n(すべて等重み)です。
制約条件 Σaᵢ = 1 下で Var(T) = σ²Σaᵢ² を最小化:
ラグランジュ乗数法により aᵢ = 1/n が最適解です。
重み配分 | 推定量 | 分散 | 効率性 |
---|---|---|---|
等重み | X̄ | σ²/n | 100% |
先頭2個のみ | (X₁+X₂)/2 | σ²/2 | 2/n × 100% |
任意の2個 | (Xᵢ+Xⱼ)/2 | σ²/2 | 2/n × 100% |
Step 9: 実用場面での効率性
Step 10: 一般的な効率性理論
一般的な設定で、推定量 Tₙ の漸近効率性は:
MLEの場合:
これにより効率性は1(100%)になります。
分布 | パラメータ | 効率的推定量 | 効率性 |
---|---|---|---|
正規分布 | μ (σ²既知) | 標本平均 | 100% |
指数分布 | λ | 1/標本平均 | 100% |
ベルヌーイ | p | 標本比率 | 100% |
ポアソン | λ | 標本平均 | 100% |
Step 11: 段階的計算の検証
ステップ | 計算 | 結果 |
---|---|---|
T₁の分散 | σ²/n = 4/100 | 0.04 |
T₂の分散 | (σ²+σ²)/4 = 8/4 | 2.0 |
効率性 | 0.04/2.0 | 0.02 |
パーセント | 0.02 × 100% | 2% |
T₂ = (X₁ + X₂)/2 の分散計算:
X₁, X₂ は独立なので:
ソフトウェア | 関数・方法 | 特徴 |
---|---|---|
R | var(), efficiency 自作関数 | 柔軟な計算 |
Python | numpy.var(), 手計算 | 数値計算 |
Matlab | var(), カスタム関数 | 行列計算 |
理論計算 | 手計算 | 正確 |
Step 12: データ分析での教訓
実際の研究報告例:
「正規分布 N(μ, 4) からの標本 n=100 について、μ の推定に標本平均 T₁=X̄ と部分平均 T₂=(X₁+X₂)/2 を比較した。T₁ の分散は 0.04、T₂ の分散は 2.0 となり、T₂ の T₁ に対する相対効率性は 0.04/2.0 = 0.02(2%)と計算された。これは T₂ で T₁ と同等の精度を得るには50倍のサンプルが必要であることを意味し、全データを活用する重要性を示している。」