単回帰分析の基本 - 回帰分析問題1 - 青の統計学-DS Playground-

単回帰分析の基本レベル1

単回帰モデル$Y_i = \beta_0 + \beta_1 X_i + \varepsilon_i$において、$\sum_{i=1}^n (X_i - \bar{X})^2 = 50$、$\sum_{i=1}^n (X_i - \bar{X})(Y_i - \bar{Y}) = 30$のとき、回帰係数$\hat{\beta}_1$の最小二乗推定値はいくらか。

解説

解答と解説を表示

<p>この問題では、統計学の基礎である<strong>単回帰分析</strong>における最小二乗法による回帰係数の推定について理解を深めます。</p><h4>単回帰モデルとは？</h4><p>単回帰モデルは、1つの説明変数$X$と1つの目的変数$Y$の関係を線形式で表現したモデルです：</p><div class='formula'>$Y_i = \beta_0 + \beta_1 X_i + \varepsilon_i

lt;/div><p>ここで：</p><ul><li>$\beta_0$：切片（intercept）</li><li>$\beta_1$：回帰係数（slope）</li><li>$\varepsilon_i$：誤差項（error term）</li></ul><h4>最小二乗法の原理</h4><p>最小二乗法は、<strong>残差平方和を最小化</strong>することで回帰係数を推定する手法です。残差平方和$S$は：</p><div class='formula'>$S = \sum_{i=1}^n (Y_i - \hat{Y}_i)^2 = \sum_{i=1}^n (Y_i - \hat{\beta}_0 - \hat{\beta}_1 X_i)^2

lt;/div><p>この$S$を最小化する$\hat{\beta}_0$と$\hat{\beta}_1$を求めます。</p><h4>最小二乗推定量の導出</h4><p class='step'>1. 正規方程式の導出</p><p>$S$を$\beta_0$と$\beta_1$で偏微分し、0と置くことで正規方程式を得ます：</p><div class='formula'>$\frac{\partial S}{\partial \beta_0} = -2\sum_{i=1}^n (Y_i - \beta_0 - \beta_1 X_i) = 0

lt;/div><div class='formula'>$\frac{\partial S}{\partial \beta_1} = -2\sum_{i=1}^n (Y_i - \beta_0 - \beta_1 X_i)X_i = 0

lt;/div><p class='step'>2. 回帰係数の最小二乗推定量</p><p>正規方程式を解くことで、以下の推定量が得られます：</p><div class='formula'>$\hat{\beta}_1 = \frac{\sum_{i=1}^n (X_i - \bar{X})(Y_i - \bar{Y})}{\sum_{i=1}^n (X_i - \bar{X})^2}

lt;/div><div class='formula'>$\hat{\beta}_0 = \bar{Y} - \hat{\beta}_1 \bar{X}

lt;/div><div class='key-point'><div class='key-point-title'>最小二乗推定量の性質</div><ul><li><strong>不偏性</strong>：$E[\hat{\beta}_1] = \beta_1$、$E[\hat{\beta}_0] = \beta_0

lt;/li><li><strong>一致性</strong>：サンプルサイズが大きくなると真の値に収束</li><li><strong>BLUE性質</strong>：線形不偏推定量の中で最小分散（ガウス・マルコフ定理）</li><li><strong>正規性</strong>：誤差項が正規分布に従う場合、推定量も正規分布に従う</li></ul></div><h4>問題の解法</h4><p class='step'>1. 与えられた情報の整理</p><ul><li>$\sum_{i=1}^n (X_i - \bar{X})^2 = 50$：説明変数の<strong>偏差平方和</strong></li><li>$\sum_{i=1}^n (X_i - \bar{X})(Y_i - \bar{Y}) = 30$：説明変数と目的変数の<strong>偏差積和</strong></li></ul><p class='step'>2. 回帰係数の計算</p><p>最小二乗推定量の公式に代入：</p><div class='formula'>$\hat{\beta}_1 = \frac{\sum_{i=1}^n (X_i - \bar{X})(Y_i - \bar{Y})}{\sum_{i=1}^n (X_i - \bar{X})^2} = \frac{30}{50} = 0.6

lt;/div><h4>結果の解釈</h4><p>$\hat{\beta}_1 = 0.6$は、説明変数$X$が1単位増加すると、目的変数$Y$が平均的に0.6単位増加することを意味します。これは<strong>正の相関関係</strong>を示しており、$X$と$Y$の間に正の線形関係があることを表しています。</p><p class='note'><strong>ポイント：</strong><br>実際の分析では、推定された回帰係数の統計的有意性を検定し、モデルの適合度（決定係数$R^2$など）や残差分析による診断も重要です。また、回帰係数の信頼区間を求めることで、推定の不確実性を評価することも必要です。</p>