基礎編

データの要約と分析の基礎を確認します。

回帰直線 レベル1

次の2変数データの回帰直線 y = ax + b の係数 a, b として最も近いものはどれか. \begin{array}{l|ccccc} \hline x & 1 & 2 & 3 & 4 & 5 \\ y & 3 & 5 & 7 & 8 & 11 \\ \hline \end{array}

解説
解答と解説を表示
<p>2変数データの回帰直線を求める問題です。</p><p class='step'>1. 回帰直線の定義</p> <p>回帰直線は、2変数データの関係を表す直線で、最小二乗法によって求められます。回帰直線の式は $y = ax + b$ の形で表され、係数 $a$(傾き)と $b$(切片)は以下の公式で計算されます。</p> <p class='formula'> \begin{align} a &= \frac{\sum_{i=1}^{n} (x_i - \bar{x})(y_i - \bar{y})}{\sum_{i=1}^{n} (x_i - \bar{x})^2} \\ b &= \bar{y} - a\bar{x} \end{align} </p><p>ここで、$\bar{x}$ と $\bar{y}$ はそれぞれ変数 $x$ と $y$ の平均値です。</p><p class='step'>2. 平均値の計算</p> <p>まず、$x$ と $y$ の平均値を計算します。</p> <p class='formula'> \begin{align} \bar{x} &= \frac{1 + 2 + 3 + 4 + 5}{5} = \frac{15}{5} = 3 \\ \bar{y} &= \frac{3 + 5 + 7 + 8 + 11}{5} = \frac{34}{5} = 6.8 \end{align} </p><p class='step'>3. 係数 $a$ の計算</p> <p>係数 $a$ を求めるために必要な各項を計算します。</p><p>$(x_i - \bar{x})(y_i - \bar{y})$ の計算:</p> <p class='formula'> \begin{align} (1 - 3)(3 - 6.8) &= (-2)(-3.8) = 7.6 \\ (2 - 3)(5 - 6.8) &= (-1)(-1.8) = 1.8 \\ (3 - 3)(7 - 6.8) &= (0)(0.2) = 0 \\ (4 - 3)(8 - 6.8) &= (1)(1.2) = 1.2 \\ (5 - 3)(11 - 6.8) &= (2)(4.2) = 8.4 \end{align} </p><p>$\sum_{i=1}^{n} (x_i - \bar{x})(y_i - \bar{y}) = 7.6 + 1.8 + 0 + 1.2 + 8.4 = 19
lt;/p><p>$(x_i - \bar{x})^2$ の計算:</p> <p class='formula'> \begin{align} (1 - 3)^2 &= (-2)^2 = 4 \\ (2 - 3)^2 &= (-1)^2 = 1 \\ (3 - 3)^2 &= (0)^2 = 0 \\ (4 - 3)^2 &= (1)^2 = 1 \\ (5 - 3)^2 &= (2)^2 = 4 \end{align} </p><p>$\sum_{i=1}^{n} (x_i - \bar{x})^2 = 4 + 1 + 0 + 1 + 4 = 10
lt;/p><p>係数 $a$ を計算します。</p> <p class='formula'> \begin{align} a &= \frac{\sum_{i=1}^{n} (x_i - \bar{x})(y_i - \bar{y})}{\sum_{i=1}^{n} (x_i - \bar{x})^2} \\ &= \frac{19}{10} \\ &= 1.9 \end{align} </p><p class='step'>4. 係数 $b$ の計算</p> <p>係数 $b$ を計算します。</p> <p class='formula'> \begin{align} b &= \bar{y} - a\bar{x} \\ &= 6.8 - 1.9 \times 3 \\ &= 6.8 - 5.7 \\ &= 1.1 \end{align} </p><p class='step'>5. 回帰直線の式</p> <p>求めた係数 $a$ と $b$ を用いて、回帰直線の式を表します。</p> <p class='formula'>$y = 1.9x + 1.1
lt;/p><p class='note'>回帰直線の意味と解釈:</p> <ul> <li>回帰直線は、2変数データの関係を最もよく表す直線です。具体的には、実際の $y$ の値と回帰直線から予測される $y$ の値との差の二乗和が最小になるように係数 $a$ と $b$ が決定されます(最小二乗法)。</li> <li>係数 $a$(傾き)は、$x$ が1単位増加したときの $y$ の平均的な増加量を表します。この問題では、$x$ が1単位増加すると、$y$ は平均して1.9単位増加することを意味します。</li> <li>係数 $b$(切片)は、$x = 0$ のときの $y$ の値を表します。ただし、データの範囲外の $x$ の値に対する予測は、モデルの適用範囲を超えている可能性があるため、注意が必要です。</li> <li>決定係数 $R^2$(相関係数の二乗)は、回帰モデルによって説明される $y$ の変動の割合を表します。$R^2$ が1に近いほど、モデルの当てはまりが良いことを示します。</li> </ul></p>
問題 1/10
カテゴリ一覧に戻る