極限・漸近理論

中心極限定理、デルタ法、スルツキーの定理など統計検定準1級レベルの漸近理論を学習します。

タイトルをここに レベル1

問題はここに

解説
解答と解説を表示

カーネル密度推定の基本概念

カーネル密度推定は、データの分布を滑らかな曲線で推定する手法です。各データ点を中心に「山」を作り、それらを重ね合わせることで全体の密度を推定します。

正解について

選択肢A:バンド幅hが大きくなると、推定密度はより滑らかになりますが、バイアスが増加します。これがバイアス・分散トレードオフの基本的な性質です。

バンド幅の役割

バンド幅hは平滑化の程度を制御します:

  • h が大きい:より滑らか、しかしバイアス大
  • h が小さい:データに忠実、しかし分散大

他の選択肢について

  • 選択肢B:hが小さくなると分散は増加します(減少ではない)
  • 選択肢C:様々なカーネル関数が使用可能です(Epanechnikov、三角など)
  • 選択肢D:標本サイズnが増加すると最適バンド幅は減少します(h ∝ n⁻¹/⁵)

バイアス・分散トレードオフ

カーネル密度推定の平均二乗誤差(MSE)は:

$$MSE = Bias^2 + Variance$$
バンド幅バイアス分散
大きい
小さい
最適中程度中程度

実用的な含意

統計検定準1級レベルでは、このバイアス・分散トレードオフの理解が重要です。データ分析において適切なバンド幅選択により、過適合と過平滑のバランスを取ることができます。

問題 1/10