スコア検定(Score Test / Lagrange Multiplier Test)の理論と応用
スコア検定は三大漸近検定手法の一つで、制約下でのみパラメータを推定すれば実行できる効率的な検定手法です。特に複雑なモデルで制約なし推定が困難な場合に威力を発揮します。
スコア検定の特徴
計算効率:制約下でのみ推定すれば実行可能で計算負荷が軽い。理論的優美性:ラグランジュ乗数法との密接な関係があります。
Step 1: スコア検定の基本理論
帰無仮説 H₀: θ = θ₀ に対するスコア統計量:
$$S = \frac{[U(\theta_0)]^2}{I(\theta_0)}$$
ここで:
- U(θ₀):θ₀でのスコア関数(対数尤度の一次微分)
- I(θ₀):θ₀でのフィッシャー情報量
帰無仮説下で S ~ χ²(r) (r は制約の数)
ポアソン分布の基本性質
ポアソン分布 Po(λ) の確率質量関数:
$$P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}, \quad k = 0, 1, 2, \ldots$$
| 統計量 | 値 | 推定量 |
|---|
| 期待値 | λ | E[X] = x̄ |
| 分散 | λ | Var(X) = x̄ |
| MLE | λ̂ = x̄ | 標本平均 |
Step 2: ポアソン分布での対数尤度関数
n個の独立標本 x₁, x₂, ..., xₙ に対する対数尤度関数:
$$\ell(\lambda) = \sum_{i=1}^n [x_i \log \lambda - \lambda - \log(x_i!)]$$
$$= \log \lambda \sum_{i=1}^n x_i - n\lambda - \sum_{i=1}^n \log(x_i!)$$
$$= n\bar{x} \log \lambda - n\lambda - \sum_{i=1}^n \log(x_i!)$$
本問では:
- n = 200
- x̄ = 3.2
- Σxᵢ = nx̄ = 640
Step 3: スコア関数の計算
対数尤度の一次微分(スコア関数):
$$U(\lambda) = \frac{d\ell(\lambda)}{d\lambda} = \frac{n\bar{x}}{\lambda} - n = \frac{n(\bar{x} - \lambda)}{\lambda}$$
H₀: λ = 3 下でのスコア関数:
$$U(3) = \frac{200 \times (3.2 - 3)}{3} = \frac{200 \times 0.2}{3} = \frac{40}{3} \approx 13.33$$
Step 4: フィッシャー情報量の計算
対数尤度の二次微分:
$$\frac{d^2\ell(\lambda)}{d\lambda^2} = -\frac{n\bar{x}}{\lambda^2}$$
フィッシャー情報量:
$$I(\lambda) = -E\left[\frac{d^2\ell(\lambda)}{d\lambda^2}\right] = E\left[\frac{n\bar{x}}{\lambda^2}\right] = \frac{n \cdot \lambda}{\lambda^2} = \frac{n}{\lambda}$$
H₀: λ = 3 下でのフィッシャー情報量:
$$I(3) = \frac{200}{3} \approx 66.67$$
Step 5: スコア統計量の計算
$$S = \frac{[U(3)]^2}{I(3)} = \frac{(13.33)^2}{66.67} = \frac{177.78}{66.67} \approx 2.67$$
より正確な計算:
$$U(3) = \frac{40}{3}, \quad I(3) = \frac{200}{3}$$
$$S = \frac{(40/3)^2}{200/3} = \frac{1600/9}{200/3} = \frac{1600}{9} \times \frac{3}{200} = \frac{1600 \times 3}{9 \times 200} = \frac{4800}{1800} = \frac{8}{3} \approx 2.67$$
小数第2位まで:2.67
別解法での検証
スコア統計量の標準化バージョン:
$$Z = \frac{U(\theta_0)}{\sqrt{I(\theta_0)}} = \frac{40/3}{\sqrt{200/3}} = \frac{40/3}{\sqrt{66.67}} \approx \frac{13.33}{8.165} \approx 1.633$$
S = Z² ≈ (1.633)² ≈ 2.67 で一致します。
スコア検定の理論的背景
Step 6: ラグランジュ乗数法との関係
制約付き最適化問題:
$$\max_{\theta} \ell(\theta) \quad \text{subject to} \quad g(\theta) = 0$$
ラグランジュ関数:
$$L(\theta, \lambda) = \ell(\theta) - \lambda g(\theta)$$
一次条件:
$$\frac{\partial L}{\partial \theta} = U(\theta) - \lambda \frac{\partial g(\theta)}{\partial \theta} = 0$$
ラグランジュ乗数 λ がスコア統計量と密接に関連します。
三大検定手法の統一理論
| 検定手法 | 基本原理 | 必要な推定 | 計算複雑度 |
|---|
| Wald検定 | 推定値と仮説値の距離 | 制約なし推定 | 高 |
| 尤度比検定 | 尤度の比較 | 両方の推定 | 最高 |
| スコア検定 | 勾配の大きさ | 制約下推定のみ | 低 |
スコア検定は最も計算効率が良い手法です。
検定の実行と判定
Step 7: 臨界値との比較
S = 2.67 と χ²(1) 分布の臨界値を比較:
| 有意水準 | 臨界値 | 判定 | p値 |
|---|
| 10% | 2.71 | 採択 | ≈ 0.102 |
| 5% | 3.84 | 採択 | ≈ 0.102 |
| 1% | 6.63 | 採択 | ≈ 0.102 |
S = 2.67 < 2.71 なので、10% 水準でも帰無仮説を棄却できません。
正確なp値の計算
χ²(1) 分布での p値:
$$p\text{-value} = P(\chi^2(1) > 2.67) \approx 0.102$$
約 10.2% の確率で観測されるデータで、有意ではありません。
他の検定統計量との比較
Step 8: Wald・尤度比統計量との比較
Wald統計量:
$$W = \frac{(\bar{x} - \lambda_0)^2}{\bar{x}/n} = \frac{(3.2 - 3)^2}{3.2/200} = \frac{0.04}{0.016} = 2.5$$
尤度比統計量:
$$\Lambda = 2[\ell(3.2) - \ell(3)] \approx 2.58$$
三統計量の比較
| 検定 | 統計量 | 本例での値 | p値 |
|---|
| スコア検定 | 2.67 | χ²(1) | 0.102 |
| Wald検定 | 2.50 | χ²(1) | 0.114 |
| 尤度比検定 | ≈ 2.58 | χ²(1) | ≈ 0.108 |
三者の値は近く、すべて有意ではない結果です。
ポアソン分布での特殊性
Step 9: 指数族としての性質
ポアソン分布は指数族に属し:
$$f(x;\lambda) = \exp\{x \log \lambda - \lambda - \log(x!)\}$$
標準形:f(x; θ) = exp{θT(x) - A(θ) + B(x)}
- 自然パラメータ:θ = log λ
- 十分統計量:T(x) = x
- キュムラント関数:A(θ) = eᶿ = λ
指数族でのスコア検定の簡略化
指数族では情報量が簡単に計算できます:
$$I(\theta) = \frac{d^2 A(\theta)}{d\theta^2}$$
ポアソン分布では:
$$I(\log \lambda) = \frac{d^2 \lambda}{d(\log \lambda)^2} = \lambda$$