この問題では、ポアソン過程の最尤推定法と統計的推論理論について理解を深めます。
ポアソン過程の最尤推定:統計的推論の基礎
ポアソン過程のパラメータ推定は、観測データから未知の確率分布パラメータを効率的に推定する統計学の根幹問題です。最尤推定法により得られる推定量は、大標本における最適性を保証する優れた統計的性質を持ちます。
Step 1: ポアソン過程の統計モデル
基本設定:
- 観測時間:$T = 3$時間(固定された観測期間)
- 観測事象数:$N(T) = 12$回(実現値)
- 未知パラメータ:$\\lambda > 0$(強度パラメータ)
- 統計モデル:$N(T) \\sim \\text{Poisson}(\\lambda T)$
ポアソン過程モデルの統計的前提
前提条件 | 数学的表現 | 実用的意味 |
---|
定常性 | $\\lambda(t) = \\lambda$(一定) | 時間を通じて強度不変 |
独立性 | 重複しない区間で独立増分 | 事象間の相互独立性 |
単純性 | 同時発生確率=0 | 瞬間的多重事象なし |
稀少性 | 微小区間での発生確率∝区間長 | 連続時間での適切な確率構造 |
Step 2: 尤度関数の構築と性質
尤度関数の定義:
観測データ$n = 12$に対して、パラメータ$\\lambda$の尤度関数は:
$$L(\\lambda | n, T) = P(N(T) = n | \\lambda) = \\frac{(\\lambda T)^n e^{-\\lambda T}}{n!}$$
数値を代入すると:
$$L(\\lambda | 12, 3) = \\frac{(3\\lambda)^{12} e^{-3\\lambda}}{12!}$$
尤度関数の解釈:
- $L(\\lambda)$:「パラメータ$\\lambda$のもとで、実際に観測されたデータの発生確率」
- 最尤原理:「観測データを最も説明しやすいパラメータ値を推定値とする」
- 統計的根拠:フィッシャー情報量と漸近効率性
Step 3: 対数尤度関数と最適化
対数尤度関数:
数値的安定性と微分の簡単化のため、対数尤度を使用:
$$\\ell(\\lambda) = \\log L(\\lambda) = n \\log(\\lambda T) - \\lambda T - \\log(n!)$$
定数項を除くと:
$$\\ell(\\lambda) = n \\log \\lambda + n \\log T - \\lambda T$$
数値代入:
$$\\ell(\\lambda) = 12 \\log \\lambda + 12 \\log 3 - 3\\lambda$$
Step 4: 最尤推定量の解析的導出
一階条件(First-Order Condition):
$$\\frac{d\\ell(\\lambda)}{d\\lambda} = \\frac{n}{\\lambda} - T = 0$$
これを$\\lambda$について解くと:
$$\\frac{n}{\\lambda} = T \\Rightarrow \\hat{\\lambda}_{MLE} = \\frac{n}{T}$$
二階条件(Second-Order Condition):
$$\\frac{d^2\\ell(\\lambda)}{d\\lambda^2} = -\\frac{n}{\\lambda^2} < 0$$
二階微分が負なので、$\\hat{\\lambda}_{MLE}$は確実に最大値です。
Step 5: 数値計算と推定結果
最尤推定量の計算:
$$\\hat{\\lambda}_{MLE} = \\frac{n}{T} = \\frac{12}{3} = 4.0 \\text{(回/時)}$$
推定結果の解釈:
- 物理的意味:1時間あたり平均4回の事象発生
- 期待総数:3時間で$3 \\times 4 = 12$回(観測値と一致)
- 直感的妥当性:「平均発生率=観測率」という自然な結果
最尤推定量の統計的性質
性質 | 数学的表現 | 実用的意味 |
---|
不偏性 | $E[\\hat{\\lambda}] = \\lambda$ | 系統的偏りなし |
一致性 | $\\hat{\\lambda} \\xrightarrow{p} \\lambda$ | 大標本で真値に収束 |
漸近効率性 | Cramér-Rao下界を達成 | 最小分散不偏推定量 |
漸近正規性 | $\\sqrt{T}(\\hat{\\lambda} - \\lambda) \\xrightarrow{d} N(0, \\lambda)$ | 信頼区間構築可能 |
統計的推論と信頼区間
Step 6: フィッシャー情報量と標準誤差
フィッシャー情報量:
$$I(\\lambda) = E\\left[\\left(\\frac{d \\log f(X;\\lambda)}{d\\lambda}\\right)^2\\right] = \\frac{T}{\\lambda}$$
標準誤差の計算:
$$SE(\\hat{\\lambda}) = \\frac{1}{\\sqrt{I(\\hat{\\lambda})}} = \\sqrt{\\frac{\\hat{\\lambda}}{T}} = \\sqrt{\\frac{4.0}{3}} \\approx 1.155$$
これは推定値の精度を表し、「真の強度は約4.0 ± 1.155の範囲」という解釈ができます。
Step 7: 信頼区間の構築
漸近正規性に基づく95%信頼区間:
$$\\hat{\\lambda} \\pm z_{0.025} \\cdot SE(\\hat{\\lambda}) = 4.0 \\pm 1.96 \\times 1.155$$
$$= 4.0 \\pm 2.264 = [1.736, 6.264]$$
正確な信頼区間(ポアソン分布の性質利用):
ポアソン分布とカイ二乗分布の関係を利用:
$$\\left[\\frac{\\chi^2_{2n, \\alpha/2}}{2T}, \\frac{\\chi^2_{2(n+1), 1-\\alpha/2}}{2T}\\right]$$
$n = 12$, $T = 3$, $\\alpha = 0.05$の場合:
$$\\left[\\frac{\\chi^2_{24, 0.025}}{6}, \\frac{\\chi^2_{26, 0.975}}{6}\\right] \\approx [2.09, 6.42]$$
Step 8: 仮説検定への応用
検定問題の設定:
- 帰無仮説:$H_0: \\lambda = \\lambda_0$(特定の値)
- 対立仮説:$H_1: \\lambda \\neq \\lambda_0$(両側検定)
- 検定統計量:$Z = \\frac{\\hat{\\lambda} - \\lambda_0}{SE(\\hat{\\lambda})}$
例:$H_0: \\lambda = 3$の検定
$$Z = \\frac{4.0 - 3.0}{\\sqrt{3.0/3}} = \\frac{1.0}{1.0} = 1.0$$
$|Z| = 1.0 < 1.96$なので、5%水準では$H_0$を棄却しません。
ベイズ推定との比較
Step 9: ベイズ推定によるアプローチ
共役事前分布:
ポアソン分布の共役事前分布はガンマ分布:
$$\\lambda \\sim \\text{Gamma}(\\alpha, \\beta)$$
事後分布:
$$\\lambda | n, T \\sim \\text{Gamma}(\\alpha + n, \\beta + T)$$
無情報事前分布での比較:
Jeffreys事前分布$p(\\lambda) \\propto \\lambda^{-1/2}$($\\text{Gamma}(1/2, 0)$)を使用すると:
$$\\lambda | n, T \\sim \\text{Gamma}(n + 1/2, T)$$
事後平均:$\\frac{n + 1/2}{T} = \\frac{12.5}{3} \\approx 4.17$
最尤推定量4.0と近い値が得られます。
頻度論 vs ベイズ推定の比較
観点 | 頻度論(最尤推定) | ベイズ推定 |
---|
推定量 | $\\hat{\\lambda} = 4.0$ | 事後平均 ≈ $4.17$ |
不確実性 | 標準誤差、信頼区間 | 事後分布全体 |
解釈 | 「データに最も適合する値」 | 「事前知識更新後の分布」 |
計算 | 解析的に簡単 | 共役性により解析的 |