回帰分析

単回帰、重回帰、ロジスティック回帰、一般化線形モデルなど統計検定準1級レベルの回帰分析手法を学習します。

一般化線形モデルの理論 レベル1

ポアソン回帰において、リンク関数が$g(\mu) = \log(\mu)$、線形予測子が$\eta = \beta_0 + \beta_1 x$のとき、平均$\mu$と線形予測子$\eta$の関係はどれか。

解説
解答と解説を表示
<h4>一般化線形モデル(GLM):指数型分布族の統一的枠組み</h4><div class='key-point'><h4>GLMの基本構成要素</h4></div><p class='step'><strong>Step 1: GLMの3つの構成要素</strong></p><div class='key-point'><h4>GLMの構成要素</h4><ol><li><strong>確率分布</strong>:指数型分布族に属する分布</li><li><strong>線形予測子</strong>:$\eta = \mathbf{x}^T\boldsymbol{\beta}
lt;/li><li><strong>リンク関数</strong>:$g(\mu) = \eta
lt;/li></ol></div><p class='step'><strong>Step 2: 指数型分布族の一般形</strong></p><p>指数型分布族は以下の形で表現される:</p><div class='formula'>$f(y|\theta, \phi) = \exp\left(\frac{y\theta - b(\theta)}{a(\phi)} + c(y, \phi)\right)$

ここで:

  • $\theta$:自然パラメータ
  • $\phi$:分散パラメータ
  • $b(\theta)$:キュムラント生成関数

Step 3: ポアソン分布の指数型表現

ポアソン分布$\text{Poisson}(\mu)$:

$P(Y = y) = \frac{\mu^y e^{-\mu}}{y!}$

指数型分布族の形に変換:

$P(Y = y) = \exp(y\log\mu - \mu - \log y!)$

ここで:

  • $\theta = \log\mu$(自然パラメータ)
  • $b(\theta) = e^\theta = \mu$
  • $a(\phi) = 1$

リンク関数の役割

分布平均の範囲正準リンク関数逆リンク関数
正規分布$(-\infty, \infty)$$g(\mu) = \mu$$\mu = \eta$
ポアソン分布$(0, \infty)$$g(\mu) = \log\mu$$\mu = e^\eta$
二項分布$(0, 1)$$g(\mu) = \log\frac{\mu}{1-\mu}$$\mu = \frac{e^\eta}{1+e^\eta}$

Step 4: ポアソン回帰の数学的導出

リンク関数の定義:

$g(\mu) = \eta$

ポアソン回帰では$g(\mu) = \log\mu$なので:

$\log\mu = \eta$

両辺の指数を取ると:

$\mu = \exp(\eta) = \exp(\beta_0 + \beta_1 x)$

ここで、$\beta_0$は切片、$\beta_1$は回帰係数です。

Step 5: 正準リンク関数の利点

  • 自然パラメータとの一致:$\theta = \eta$
  • 計算の簡便性:尤度関数が簡潔になる
  • 統計的性質:推定量の漸近的性質が良好

Step 6: 最尤推定

対数尤度関数:

$\ell(\boldsymbol{\beta}) = \sum_{i=1}^n [y_i\eta_i - \exp(\eta_i) - \log y_i!]$

スコア関数:

$\frac{\partial \ell}{\partial \beta_j} = \sum_{i=1}^n (y_i - \mu_i) x_{ij}$</div><div class='key-point'><h4>GLMの応用例</h4><ul><li><strong>ポアソン回帰</strong>:カウントデータ(事故件数、顧客数等)</li><li><strong>ロジスティック回帰</strong>:二値データ(成功/失敗、購入/非購入等)</li><li><strong>ガンマ回帰</strong>:正の連続データ(待ち時間、価格等)</li></ul></div>
問題 1/10
カテゴリ一覧に戻る