回帰分析

単回帰、重回帰、ロジスティック回帰、一般化線形モデルなど統計検定準1級レベルの回帰分析手法を学習します。

一般化線形モデルの応用 レベル1

ポアソン分布を仮定した一般化線形モデル(GLM)で、リンク関数が対数関数である場合を考える。線形予測子が $\eta_1 = 1.0$、$\eta_2 = 1.5$ の2つの観測について、対応する期待値 $\mu_1$、$\mu_2$ の比 $\mu_2 / \mu_1$ はいくらか。

解説
解答と解説を表示

一般化線形モデル(GLM)の基本概念

一般化線形モデルは、線形回帰を拡張したモデルで、目的変数が指数族分布に従う場合に適用されます。

GLMの3つの構成要素

  1. 確率分布:指数族分布(正規、ポアソン、二項分布など)
  2. 線形予測子:$\\eta = \\mathbf{x}^T\\boldsymbol{\\beta}$
  3. リンク関数:$g(\\mu) = \\eta$ により期待値と線形予測子を結ぶ

Step 1: ポアソン分布のGLM

ポアソン分布を仮定したGLMでは:

  • 確率分布:$Y \\sim \\text{Poisson}(\\mu)$
  • 期待値:$E[Y] = \\mu$
  • 分散:$\\text{Var}(Y) = \\mu$
  • 自然リンク関数:$g(\\mu) = \\log(\\mu)$

Step 2: リンク関数と逆リンク関数

対数リンク関数の場合:

$$g(\\mu) = \\log(\\mu) = \\eta$$

逆リンク関数(応答関数):

$$\\mu = g^{-1}(\\eta) = \\exp(\\eta)$$

これにより、線形予測子から期待値を計算できます。

Step 3: 与えられた線形予測子の処理

問題の設定:

  • $\\eta_1 = 1.0$
  • $\\eta_2 = 1.5$

逆リンク関数を適用:

$$\\mu_1 = \\exp(\\eta_1) = \\exp(1.0) = e^1 \\approx 2.718$$
$$\\mu_2 = \\exp(\\eta_2) = \\exp(1.5) = e^{1.5} \\approx 4.482$$

Step 4: 期待値の比の計算

$$\\frac{\\mu_2}{\\mu_1} = \\frac{\\exp(1.5)}{\\exp(1.0)} = \\exp(1.5 - 1.0) = \\exp(0.5)$$
$$= e^{0.5} \\approx 1.649$$

約1.65となります。

対数リンク関数の性質

対数リンク関数を使用する場合の性質:

  • 乗法的効果:線形予測子の差は期待値の比の対数
  • 指数変換:$\\mu = \\exp(\\eta)$ により常に正の値
  • 比例性:$\\eta$ の単位増加で $\\mu$ は $e$ 倍に増加

Step 5: 結果の検証

計算の確認:

$$e^{0.5} = \\sqrt{e} \\approx \\sqrt{2.718} \\approx 1.649$$

選択肢の中では「約1.65」が最も近い値です。

Step 6: GLMにおける推定と診断

GLMの推定手法

  • 最尤推定:反復重み付き最小二乗法(IRLS)
  • 偏差度:$D = 2[\\ell(\\hat{\\mu}_{sat}) - \\ell(\\hat{\\mu})]$
  • 情報量基準:AIC, BIC による モデル選択
  • 残差分析:Pearson残差、deviance残差

Step 7: ポアソン回帰の応用例

ポアソン回帰は以下の場面で使用されます:

  • カウントデータ:事故件数、販売個数など
  • 頻度データ:単位時間・面積あたりの発生回数
  • 稀な事象:疾病の発症率、故障率など

Step 8: 過分散への対応

ポアソン分布では平均と分散が等しいと仮定しますが、実際のデータでは過分散(分散 > 平均)が起こることがあります。この場合:

  • 準ポアソン回帰:分散を $\\phi \\mu$ に調整
  • 負の二項回帰:ガンマ混合ポアソン分布
  • ゼロ過剰モデル:ゼロが多い場合の拡張

GLMの利点

  • 柔軟性:様々な分布に対応
  • 解釈性:線形予測子による説明変数の効果
  • 理論的基盤:最尤推定の性質を利用
  • 診断手法:豊富な適合度検定と残差分析
問題 1/10
カテゴリ一覧に戻る