不偏分散におけるn-1補正の理論的背景
標本分散を$n-1$で割ることで得られる不偏分散は、統計推定の概念の一つです。この補正は、自由度の消費という数学的原理に基づいています。
自由度の消費メカニズム
標本平均$\bar{x}$を使って分散を推定するとき、制約が生じます:
$\sum_{i=1}^n (x_i - \bar{x}) = 0$ (常に成り立つ)
この制約により、$n$個の偏差のうち$n-1$個が決まれば最後の1個は自動的に決まるため、自由度は$n-1$になります。
バイアスが生じる理由
標本平均$\bar{x}$は最小二乗法により$\sum(x_i - \bar{x})^2$を最小化しています:
$\sum_{i=1}^n (x_i - \bar{x})^2 \leq \sum_{i=1}^n (x_i - \mu)^2$
つまり、標本平均を使った平方和は真の母平均を使った場合よりも必ず小さくなるため、下方バイアスが生じます。
証明
$E\left[\sum_{i=1}^n (X_i - \bar{X})^2\right] = E\left[\sum_{i=1}^n (X_i - \mu)^2 - n(\bar{X} - \mu)^2\right]$
$= n\sigma^2 - nVar(\bar{X}) = n\sigma^2 - n\frac{\sigma^2}{n} = (n-1)\sigma^2$
したがって:
$E\left[\frac{1}{n-1}\sum_{i=1}^n (X_i - \bar{X})^2\right] = \sigma^2$
| 推定方法 | 分母 | バイアス | 特徴 |
|---|
| 最尤推定 | n | あり(負) | 大標本で一致 |
| 不偏推定 | n-1 | なし | 有限標本で正確 |
注意点:不偏性が必ずしも「良い」推定量であることを意味しません。少しのバイアスがあっても分散が小さい方が平均二乗誤差(MSE)で優れる場合があります。