アルゴリズム編

最適化アルゴリズム、損失関数問題に関する計算問題

損失関数の勾配 (MSE) レベル1

単一の出力を持つ線形モデル \(\hat{y} = wx\) を考えます。入力 \(x=2\)、重み \(w=1.5\) のとき、予測値は \(\hat{y}=3\) です。正解値が \(y=4\) の場合の平均二乗誤差 (MSE) 損失 \(L = \frac{1}{2}(\hat{y} - y)^2\) に関する重み \(w\) の勾配 \(\frac{\partial L}{\partial w}\) を計算してください。

解説
解答と解説を表示
<h4>損失関数の勾配計算 (連鎖律の適用)</h4> <p>損失関数 \(L\) のパラメータ \(w\) に関する勾配 \(\frac{\partial L}{\partial w}\) を計算するには、連鎖律を用います。損失 \(L\) は予測値 \(\hat{y}\) の関数であり、予測値 \(\hat{y}\) は重み \(w\) の関数であるため、以下のように分解できます。</p> <div class="formula"> $\frac{\partial L}{\partial w} = \frac{\partial L}{\partial \hat{y}} \times \frac{\partial \hat{y}}{\partial w}$ </div><h5>ステップ1: \(L\) の \(\hat{y}\) に関する偏微分の計算</h5> <p>損失関数は \(L = \frac{1}{2}(\hat{y} - y)^2\) です。これを \(\hat{y}\) で偏微分します(\(y\) は定数として扱います)。</p> <div class="formula"> $\frac{\partial L}{\partial \hat{y}} = \frac{\partial}{\partial \hat{y}} \left( \frac{1}{2}(\hat{y} - y)^2 \right)\\= \frac{1}{2} \times 2(\hat{y} - y) \times \frac{\partial}{\partial \hat{y}}(\hat{y} - y) \quad \\ = (\hat{y} - y) \times 1 \ = \hat{y} - y$ </div><h5>ステップ2: \(\hat{y}\) の \(w\) に関する偏微分の計算</h5> <p>モデルの予測式は \(\hat{y} = wx\) です。これを \(w\) で偏微分します(\(x\) は定数として扱います)。</p> <div class="formula"> $ \frac{\partial \hat{y}}{\partial w} = \frac{\partial}{\partial w}(wx) = x$ </div><h5>ステップ3: 連鎖律による勾配の結合</h5> <p>ステップ1とステップ2の結果を連鎖律の式に代入します。</p> <div class="formula"> $\frac{\partial L}{\partial w} = \frac{\partial L}{\partial \hat{y}} \times \frac{\partial \hat{y}}{\partial w} = (\hat{y} - y) \times x$ </div><h5>ステップ4: 具体的な値の代入</h5> <p>与えられた値 \(x=2, w=1.5, y=4\) を使って、まず予測値 \(\hat{y}\) を計算します。</p> <div class="formula"> $\hat{y} = w x = 1.5 \times 2 = 3$ </div> <p>次に、これらの値を勾配の式に代入します。</p> <div class="formula"> $\frac{\partial L}{\partial w} = (\hat{y} - y) \times x = (3 - 4) \times 2 = (-1) \times 2 = -2$ </div><p>したがって、重み \(w\) に関する損失の勾配は <strong>-2.0</strong> です。</p><div class="key-point"> <div class="key-point-title">勾配の意味と利用</div> <ul> <li>勾配 \(\frac{\partial L}{\partial w} = -2\) は、現在の点 (w=1.5) において、重み \(w\) をわずかに増加させると損失 \(L\) が減少することを示しています(勾配が負のため)。</li> <li>最急降下法では、この勾配の逆方向(この場合は正の方向)に重みを更新することで、損失を最小化しようとします。更新量は \(-\eta \frac{\partial L}{\partial w} = -\eta (-2) = 2\eta\) となります。</li> </ul> </div>
問題 1/3
カテゴリ一覧に戻る