回帰分析編

回帰分析の基礎や評価指標についての知識を確認します

決定係数 レベル1

次の2変数データに対して単回帰分析を行ったところ、回帰直線は y = 1 + 2x となった。このモデルの決定係数 R² を求めよ。小数第2位まで求めよ。 \begin{array}{l|ccccc} \hline x & 1 & 2 & 3 & 4 & 5 \\ y & 3 & 5 & 7 & 9 & 11 \\ \hline \end{array}

解説
解答と解説を表示
<p>単回帰モデルの決定係数を求める問題です。</p><p class='step'>1. 決定係数の定義</p> <p>決定係数 $R^2$ は、回帰モデルによって説明される応答変数の変動の割合を表す指標です。以下の式で計算されます:</p> <p class='formula'>$R^2 = 1 - \frac{SSE}{SST} = \frac{SSR}{SST}
lt;/p><p>ここで:</p> <ul> <li>$SSE$ (Sum of Squared Errors):残差平方和 $\sum_{i=1}^{n} (y_i - \hat{y}_i)^2
lt;/li> <li>$SST$ (Total Sum of Squares):全変動 $\sum_{i=1}^{n} (y_i - \bar{y})^2
lt;/li> <li>$SSR$ (Regression Sum of Squares):回帰による変動 $\sum_{i=1}^{n} (\hat{y}_i - \bar{y})^2
lt;/li> </ul><p>また、$R^2$ は相関係数 $r$ の二乗にも等しいです:$R^2 = r^2
lt;/p><p class='step'>2. 予測値の計算</p> <p>回帰直線 $y = 1 + 2x$ を用いて、各 $x$ の値に対する予測値 $\hat{y}$ を計算します。</p> <p class='formula'> \begin{align} \hat{y}_1 &= 1 + 2 \times 1 = 3 \\ \hat{y}_2 &= 1 + 2 \times 2 = 5 \\ \hat{y}_3 &= 1 + 2 \times 3 = 7 \\ \hat{y}_4 &= 1 + 2 \times 4 = 9 \\ \hat{y}_5 &= 1 + 2 \times 5 = 11 \end{align} </p><p class='step'>3. 残差の計算</p> <p>残差 $e_i = y_i - \hat{y}_i$ を計算します。</p> <p class='formula'> \begin{align} e_1 &= 3 - 3 = 0 \\ e_2 &= 5 - 5 = 0 \\ e_3 &= 7 - 7 = 0 \\ e_4 &= 9 - 9 = 0 \\ e_5 &= 11 - 11 = 0 \end{align} </p><p>すべての残差が0であることがわかります。これは、すべての観測値が回帰直線上に完全に乗っていることを意味します。</p><p class='step'>4. 決定係数の計算</p> <p>残差平方和 $SSE$ を計算します。</p> <p class='formula'> \begin{align} SSE &= \sum_{i=1}^{n} e_i^2 \\ &= 0^2 + 0^2 + 0^2 + 0^2 + 0^2 \\ &= 0 \end{align} </p><p>$y$ の平均値を計算します。</p> <p class='formula'> \begin{align} \bar{y} &= \frac{3 + 5 + 7 + 9 + 11}{5} \\ &= \frac{35}{5} \\ &= 7 \end{align} </p><p>全変動 $SST$ を計算します。</p> <p class='formula'> \begin{align} SST &= \sum_{i=1}^{n} (y_i - \bar{y})^2 \\ &= (3 - 7)^2 + (5 - 7)^2 + (7 - 7)^2 + (9 - 7)^2 + (11 - 7)^2 \\ &= (-4)^2 + (-2)^2 + 0^2 + 2^2 + 4^2 \\ &= 16 + 4 + 0 + 4 + 16 \\ &= 40 \end{align} </p><p>決定係数 $R^2$ を計算します。</p> <p class='formula'> \begin{align} R^2 &= 1 - \frac{SSE}{SST} \\ &= 1 - \frac{0}{40} \\ &= 1 - 0 \\ &= 1 \end{align} </p><p class='step'>5. 結果の解釈</p> <p>決定係数 $R^2 = 1$ は、モデルが応答変数 $y$ の変動を100%説明していることを意味します。これは、すべての観測値が回帰直線上に完全に乗っている場合にのみ起こります。</p><p>この問題では、データが完全に直線上に並んでいるため、$R^2 = 1$ となっています。実際のデータ分析では、このような完璧な当てはまりはまれであり、通常は $0 < R^2 < 1$ の値をとります。</p><p class='note'>決定係数の解釈と注意点:</p> <ul> <li>$R^2 = 0$:モデルは応答変数の変動を全く説明していない</li> <li>$R^2 = 1$:モデルは応答変数の変動を完全に説明している</li> <li>一般的に、$R^2$ が高いほどモデルの当てはまりが良いとされますが、高い $R^2$ だけでモデルの良さを判断するべきではありません</li> <li>説明変数を増やすと $R^2$ は常に増加するため、多重回帰分析では調整済み $R^2$ を用いることがあります</li> <li>$R^2$ は線形関係の強さを測るものであり、非線形関係を捉えることはできません</li> </ul><p>したがって、このモデルの決定係数 $R^2$ は1.00(小数第2位まで)です。</p>
問題 1/10
カテゴリ一覧に戻る