中心極限定理、デルタ法、スルツキーの定理など統計検定準1級レベルの漸近理論を学習します。
問題はここに
カーネル密度推定は、データの分布を滑らかな曲線で推定する手法です。各データ点を中心に「山」を作り、それらを重ね合わせることで全体の密度を推定します。
選択肢A:バンド幅hが大きくなると、推定密度はより滑らかになりますが、バイアスが増加します。これがバイアス・分散トレードオフの基本的な性質です。
バンド幅の役割
バンド幅hは平滑化の程度を制御します:
バイアス・分散トレードオフ
カーネル密度推定の平均二乗誤差(MSE)は:
バンド幅 | バイアス | 分散 |
---|---|---|
大きい | 大 | 小 |
小さい | 小 | 大 |
最適 | 中程度 | 中程度 |
統計検定準1級レベルでは、このバイアス・分散トレードオフの理解が重要です。データ分析において適切なバンド幅選択により、過適合と過平滑のバランスを取ることができます。