変数選択基準 - 問題演習問題17 - 青の統計学-DS Playground-

変数選択基準レベル1

重回帰分析における変数選択基準の一つであるAIC（赤池情報量規準）について、正しい記述はどれか。

解説

解答と解説を表示

変数選択基準であるAIC（赤池情報量規準）の理解を問う問題です。 AICは、モデルの複雑さと当てはまりの良さのバランスを評価し、より予測に適したモデルを選択するための指標です。 1. AIC（赤池情報量規準）とは AIC (Akaike's Information Criterion) は、統計モデルの良さを評価するための指標の一つです。モデルがデータにどれだけよく適合しているか（当てはまりの良さ）と、モデルの複雑さ（パラメータの数）のバランスを考慮します。AICの値が小さいほど、より良いモデルであると評価されます。 $AIC = -2 \times (最大対数尤度) + 2 \times (パラメータ数)

lt;/p> 第一項はモデルの当てはまりの良さを示し、当てはまりが良いほどこの項は小さくなります。第二項はモデルの複雑さに対するペナルティであり、パラメータ数が多いほどこの項は大きくなります。 2. AICの利用目的 AICは主に以下の目的で利用されます。 <ul> <li>モデル選択：複数の候補モデルの中から、最も良いとされるモデルを選択する。AICが最小となるモデルが、予測の観点から最も良いモデルとされます。</li> <li>過剰適合（オーバーフィッティング）の抑制：不必要に複雑なモデルを選択することを避けるのに役立ちます。</li> </ul> 3. 他の選択肢の検討 <ul> <li>「AICの値が大きいほど、モデルの当てはまりが良いとされる。」：誤りです。AICの値が小さいほど良いモデルとされます。</li> <li>「AICは、モデルの複雑さ（パラメータ数）に対してペナルティを課さない。」：誤りです。AICの定義式に含まれる第二項が、パラメータ数に応じたペナルティです。</li> <li>「AICが最小となるモデルが、常に真のモデルと一致する。」：誤りです。AICはあくまで情報量基準の一つであり、最小AICモデルが真のモデルと一致する保証はありません。しかし、予測の観点からは良いモデルと期待されます。</li> <li>「AICは、説明変数間の多重共線性の問題を解決するために用いられる。」：誤りです。AICは変数選択の指標であり、多重共線性の問題を直接解決するものではありません。多重共線性の対処にはVIFの確認やリッジ回帰などの手法があります。</li> </ul> 関連する情報量規準 <ul> <li>BIC (Bayesian Information Criterion)：AICと同様にモデル選択に用いられますが、AICよりもパラメータ数に対するペナルティが大きくなる傾向があり、よりシンプルなモデルを選択しやすいです。</li> <li>Adjusted R-squared (自由度調整済み決定係数)：説明変数の数を考慮した決定係数で、これもモデル選択に利用されます。</li> </ul> したがって、AICについて正しい記述は「AICは、モデルの予測精度を評価するために用いられ、値が小さいほど良いモデルとされる。」です。

回帰分析編