ロジスティック回帰分析の基本的な用途を問う問題です。
ロジスティック回帰は、結果が2つのカテゴリのいずれかに分類される事象の確率を予測するのに適しています。
1. ロジスティック回帰とは
ロジスティック回帰分析は、応答変数(目的変数)がカテゴリカルデータ、特に二値変数(0か1か、成功か失敗かなど)である場合に、その事象が発生する確率を説明変数(独立変数)の線形結合でモデル化する統計手法です。線形回帰とは異なり、確率は0から1の範囲に収まるように、ロジット関数(シグモイド関数の一種)を介して変換を行います。
$P(Y=1|X) = \frac{1}{1 + e^{-(\beta_0 + \beta_1X_1 + ... + \beta_pX_p)}}$
この式は、ある説明変数の組み合わせ $X$ が与えられたときに、$Y=1$ となる確率を示しています。
2. 応答変数の種類
問題で挙げられている選択肢と、それぞれに適した分析手法を考えてみましょう。
- 連続値:線形回帰分析などが用いられます。
- カテゴリカル変数(3つ以上の順序のないカテゴリ):多項ロジスティック回帰や名義ロジスティック回帰などが用いられます。
- 二値変数:ロジスティック回帰分析(二項ロジスティック回帰)が最も一般的に用いられます。
- 時間経過とともに変化するデータ:時系列分析(ARIMAモデル、指数平滑法など)が用いられます。
- カウントデータ:ポアソン回帰分析や負の二項回帰分析などが用いられます。
3. ロジスティック回帰の応用例
ロジスティック回帰は様々な分野で応用されています。
- 医学:ある病気の発生確率の予測(例:喫煙本数と肺がん発生確率)
- マーケティング:顧客が特定の商品を購入する確率の予測(例:年齢、性別と購入確率)
- 金融:ローンのデフォルト確率の予測(例:収入、借入額とデフォルト確率)
補足:オッズとオッズ比
ロジスティック回帰では、オッズという概念が重要になります。オッズは、ある事象が起こる確率 $p$ と起こらない確率 $(1-p)$ の比で定義されます:
Odds = $\frac{p}{1-p}$
ロジスティック回帰モデルは、対数オッズ(ロジット)が説明変数の線形結合で表されると仮定します:
$ln(Odds) = \beta_0 + \beta_1X_1 + ... + \beta_pX_p$
説明変数が1単位変化したときのオッズの変化の比率をオッズ比といい、ロジスティック回帰係数の解釈に用いられます。
したがって、ロジスティック回帰分析が主に用いられるのは、応答変数が二値変数の場合です。