機械学習編

基礎的な機械学習ロジックの理解を問います

線形回帰: 重回帰の予測 レベル1

家の価格yを、家の広さx_1と築年数x_2から予測する重回帰モデル \(\hat{y} = w_0 + w_1x_1 + w_2x_2\) を学習しました。学習されたパラメータが \(w_0 = 500, w_1 = 80, w_2 = -5\) である場合、広さ x_1 = 100 (平方メートル)、築年数 x_2 = 10 (年) の家の価格の予測値 \(\hat{y}\) を計算してください。(単位は万円とします)

解説
解答と解説を表示
<h4>重回帰モデル (Multiple Linear Regression) とは?</h4> <p>入力変数(説明変数)が複数ある場合の線形回帰を重回帰と呼びます。目的変数 \(y\) を複数の説明変数 \(x_1, x_2, ..., x_p\) の線形結合で予測することで、より複雑な関係性を捉えようとします。</p> <div class="formula"> $\hat{y} = w_0 + w_1 x_1 + w_2 x_2 + ... + w_p x_p = w_0 + \sum_{j=1}^{p} w_j x_j
lt;/div> <ul> <li>\(\hat{y}\) : 目的変数 \(y\) の予測値(例: 家の価格)</li> <li>\(x_1, ..., x_p\) : \(p\) 個の説明変数(例: 広さ、築年数)。</li> <li>\(w_0\) : 切片。全ての説明変数が0のときの予測値。</li> <li>\(w_1, ..., w_p\) : 各説明変数に対応する<strong>係数(偏回帰係数)</strong>。他の変数を一定とした場合、その変数が1単位増加したときの \(\hat{y}\) の変化量。</li> </ul> <p>学習では、最小二乗法などを用いて、実際の値 \(y\) と予測値 \(\hat{y}\) の誤差を最小にするパラメータ \(w_0, w_1, ..., w_p\) を求めます。</p> <h4>予測値の計算</h4> <p>学習済みのモデル(家の価格予測):</p> <div class="formula"> $ \hat{y} = 500 + 80 x_1 - 5 x_2
lt;/div> <p>予測したい家の情報:</p> <ul> <li>広さ \(x_1 = 100\) (平方メートル)</li> <li>築年数 \(x_2 = 10\) (年)</li> </ul> <p>モデルに値を代入して予測価格 \(\hat{y}\) (単位: 万円) を計算します:</p> <div class="formula"> $ \hat{y} = 500 + (80 \times 100) + (-5 \times 10) = 500 + 8000 - 50 = 8450
lt;/div> <p>したがって、予測価格は <strong>8450</strong> (万円) です。</p> <div class="key-point"> <div class="key-point-title">重要ポイント:重回帰の解釈と注意点</div> <ul> <li><strong>係数の解釈:</strong> \(w_1=80\) は「築年数が同じなら、広さが1㎡増えると価格が80万円上がる」、\(w_2=-5\) は「広さが同じなら、築年数が1年増えると価格が5万円下がる」と解釈できます(他の変数を固定した場合)。</li> <li><strong>多重共線性:</strong> 説明変数間に強い相関があると(例: 部屋数と広さ)、係数の推定が不安定になり解釈が困難になることがあります。</li> <li><strong>変数選択:</strong> どの説明変数をモデルに含めるかが重要です。</li> <li><strong>線形性の仮定:</strong> 説明変数と目的変数の間に線形関係を仮定しています。非線形関係がある場合は、モデルの工夫が必要です。</li> <li><strong>適用例:</strong> 複数の要因が結果に影響する現象の分析・予測(例: 顧客の購買額予測、株価予測の要因分析)。</li> </ul> </div>
問題 1/1
カテゴリ一覧に戻る