統計的推定

標本と母集団の概念、標本平均・標本分散の性質、信頼区間の基礎、母平均の推定に関する問題

なぜ不偏分散を使うのかレベル1

分散の推定で標本分散を $n$ でなく $n-1$ で割る主な理由として最も適切なものはどれか。

解説

解答と解説を表示

標本分散を$n-1$で割ることで得られる不偏分散は、統計推定の概念の一つです。この補正は、自由度の消費という数学的原理に基づいています。

標本平均$\bar{x}$を使って分散を推定するとき、制約が生じます：

$\sum_{i=1}^n (x_i - \bar{x}) = 0$ （常に成り立つ）

この制約により、$n$個の偏差のうち$n-1$個が決まれば最後の1個は自動的に決まるため、自由度は$n-1$になります。

標本平均$\bar{x}$は最小二乗法により$\sum(x_i - \bar{x})^2$を最小化しています：

$\sum_{i=1}^n (x_i - \bar{x})^2 \leq \sum_{i=1}^n (x_i - \mu)^2$

つまり、標本平均を使った平方和は真の母平均を使った場合よりも必ず小さくなるため、下方バイアスが生じます。

$E\left[\sum_{i=1}^n (X_i - \bar{X})^2\right] = E\left[\sum_{i=1}^n (X_i - \mu)^2 - n(\bar{X} - \mu)^2\right]$

$= n\sigma^2 - nVar(\bar{X}) = n\sigma^2 - n\frac{\sigma^2}{n} = (n-1)\sigma^2$

したがって：

$E\left[\frac{1}{n-1}\sum_{i=1}^n (X_i - \bar{X})^2\right] = \sigma^2$

推定方法	分母	バイアス	特徴
最尤推定	n	あり（負）	大標本で一致
不偏推定	n-1	なし	有限標本で正確

注意点：不偏性が必ずしも「良い」推定量であることを意味しません。少しのバイアスがあっても分散が小さい方が平均二乗誤差（MSE）で優れる場合があります。

問題検索