この問題では、分類問題における手法の一つであるロジスティック回帰(Logistic Regression)について理解を深めます。
ロジスティック回帰とは?
ロジスティック回帰は、目的変数が二値(0または1)の場合に使用される回帰手法です。線形回帰とは異なり、確率を直接モデル化するのではなく、ロジット変換を用いて線形関係を表現します。
ロジスティック回帰モデルの構成
1. 確率の定義
成功確率を$p$とすると、失敗確率は$1-p$です。
2. オッズ(Odds)
オッズは成功確率と失敗確率の比で定義されます:
$\text{Odds} = \frac{p}{1-p}$
3. ロジット変換(Logit Transform)
オッズの自然対数を取ったものがロジットです:
$\text{Logit}(p) = \log\left(\frac{p}{1-p}\right)$
ロジスティック回帰の数学的表現
ロジスティック回帰モデルは以下のように表現されます:
$\log\left(\frac{p}{1-p}\right) = \beta_0 + \beta_1 x_1 + \beta_2 x_2 + \cdots + \beta_k x_k$
これを確率$p$について解くと:
$p = \frac{\exp(\beta_0 + \beta_1 x_1 + \cdots + \beta_k x_k)}{1 + \exp(\beta_0 + \beta_1 x_1 + \cdots + \beta_k x_k)}$
または、シグモイド関数を用いて:
$p = \frac{1}{1 + \exp(-(\beta_0 + \beta_1 x_1 + \cdots + \beta_k x_k))}$
ロジスティック回帰の特徴
- 確率の範囲:$0 \leq p \leq 1$が自動的に保証される
- S字曲線:シグモイド関数により滑らかなS字型の関係を表現
- 線形性:ロジット変換により説明変数との線形関係を仮定
- 最尤推定:パラメータは最尤法により推定される
問題の解法
1. 与えられたモデルの確認
ロジスティック回帰モデル:
$\log\left(\frac{p}{1-p}\right) = -2 + 0.5x$
ここで、$\beta_0 = -2$、$\beta_1 = 0.5$です。
2. x = 4におけるロジットの計算
$x = 4$を代入:
$\log\left(\frac{p}{1-p}\right) = -2 + 0.5 \times 4 = -2 + 2 = 0$
3. オッズの計算
ロジットが0なので:
$\frac{p}{1-p} = \exp(0) = 1$
4. 確率の計算
オッズが1のとき:
$\frac{p}{1-p} = 1 \Rightarrow p = 1-p \Rightarrow 2p = 1 \Rightarrow p = 0.5$
結果の解釈
$x = 4$のとき成功確率が0.5(50%)であることは以下を意味します:
- 境界点:この点で成功と失敗の確率が等しい
- 決定境界:分類問題では、通常この点を境界として判定を行う
- オッズ比:$x$が1単位増加すると、オッズが$\exp(0.5) \approx 1.65$倍になる
ポイント:
ロジスティック回帰では、回帰係数の解釈がオッズ比として行われることが大事なポイントです。また、モデルの適合度評価には尤度比検定やAIC、予測精度の評価には混合行列やROC曲線などが使用されます。