アルゴリズム編

探索・ソート・計算量・最適化手法など、AI・機械学習で必要となるアルゴリズムの基礎問題

AdaGradの理解（概念）レベル3

AdaGradの特徴として最も適切な説明を1つ選んでください。

解説

解答と解説を表示

AdaGrad（Adaptive Gradient）は、全パラメータに同一の学習率を適用するのではなく、各パラメータの勾配履歴を使って更新幅を自動調整する最適化手法です。頻繁に更新される方向は慎重に、希少な方向は相対的に大きく更新する、という設計思想を持ちます。

$w_{t+1}=w_t-\frac{\eta}{\sqrt{h_t+\epsilon}}g_t$

$h_t$ が増えるほど分母が大きくなり、実効学習率は低下します。これは「同じ方向に大きな勾配が続く座標ほど更新を抑える」効果を生みます。

G検定での押さえ方

問題検索