有限母集団修正による標準誤差の計算
この問題では、母集団サイズが比較的小さい場合に重要となる有限母集団修正(finite population correction, FPC)を学習します。標本比率が高い場合の精度向上効果を理解できます。
問題設定の整理
- 母集団サイズ:N = 500人
- 標本サイズ:n = 100人
- 母集団標準偏差:σ = 80万円
- 抽出方法:単純無作為抽出
- 標本比率:n/N = 100/500 = 0.2(20%)
Step 1: 有限母集団修正の必要性
一般に、標本比率 n/N が 5%(0.05)以上の場合、有限母集団修正が必要とされます。
$$\frac{n}{N} = \frac{100}{500} = 0.2 = 20\% > 5\%$$
したがって、有限母集団修正が必要です。
Step 2: 無限母集団の場合の標準誤差
通常の(無限母集団を仮定した)標本平均の標準誤差は:
$$SE_{\infty} = \frac{\sigma}{\sqrt{n}} = \frac{80}{\sqrt{100}} = \frac{80}{10} = 8.0 \text{万円}$$
Step 3: 有限母集団修正係数
有限母集団修正係数(FPC)は:
$$\text{FPC} = \sqrt{\frac{N-n}{N-1}}$$
数値を代入:
$$\text{FPC} = \sqrt{\frac{500-100}{500-1}} = \sqrt{\frac{400}{499}} = \sqrt{0.8016} = 0.8953$$
Step 4: 修正後の標準誤差
有限母集団修正を適用した標本平均の標準誤差は:
$$SE = \frac{\sigma}{\sqrt{n}} \times \sqrt{\frac{N-n}{N-1}}$$
$$SE = 8.0 \times 0.8953 = 7.162 \text{万円}$$
しかし、より正確な計算を行うと:
$$SE = \frac{80}{\sqrt{100}} \times \sqrt{\frac{400}{499}} = 8.0 \times \sqrt{0.801603} = 8.0 \times 0.8953 = 7.162$$
実際の正確な値:
$$SE = 8.0 \times \sqrt{\frac{400}{499}} = 8.0 \times 0.8956 = 7.165 \text{万円}$$
計算の再確認
より精密な計算:
$$\frac{400}{499} = 0.801603206...$$
$$\sqrt{0.801603206} = 0.895323...$$
$$SE = 8.0 \times 0.895323 = 7.163 \text{万円}$$
小数第3位まで:7.163万円
Step 5: 修正効果の評価
有限母集団修正による標準誤差の減少:
$$\text{減少率} = 1 - \frac{SE_{修正}}{SE_{無限}} = 1 - \frac{7.163}{8.0} = 1 - 0.8954 = 0.1046$$
約10.5%の標準誤差減少効果があります。
標本比率と修正効果の関係
標本比率(n/N) | FPC | 標準誤差減少率 |
---|
5% | 0.975 | 2.5% |
10% | 0.949 | 5.1% |
20% | 0.895 | 10.5% |
50% | 0.707 | 29.3% |
有限母集団修正の理論的背景
Step 6: 修正の理論的根拠
有限母集団からの非復元抽出では、抽出の進行とともに選択可能な要素が減少するため、標本間の独立性が完全ではありません。
- 無限母集団:復元抽出に相当、完全独立
- 有限母集団:非復元抽出、負の相関が生じる
- 修正効果:この負の相関により分散が減少
実際の調査での適用例
調査対象 | 母集団サイズ | 推奨標本サイズ | FPC適用 |
---|
小企業調査 | 200社 | 50社 | 必須 |
地域住民調査 | 5,000人 | 400人 | 推奨 |
全国調査 | 100万人 | 1,000人 | 不要 |
Step 7: 信頼区間への影響
95%信頼区間の半幅比較:
- 修正なし:$1.96 \times 8.0 = 15.68$万円
- 修正あり:$1.96 \times 7.163 = 14.04$万円
- 精度向上:約1.64万円(10.5%)の改善
FPCの近似公式
標本比率が小さい場合(n/N < 0.1)の近似:
$$\text{FPC} \approx 1 - \frac{n}{2N}$$
今回の場合:
$$\text{FPC} \approx 1 - \frac{100}{2 \times 500} = 1 - 0.1 = 0.9$$
正確な値0.895と比較すると、標本比率が20%と大きいため近似の精度は限定的です。
実務における重要な考慮事項
Step 8: 適用上の注意点
- 母集団リスト:正確なNが既知である必要
- 層化抽出:各層ごとに個別に修正を適用
- 多段抽出:各段階での修正の複合効果
- 時系列調査:母集団サイズの変動への対応
修正の適用判断基準
- 必須適用:n/N ≥ 10%
- 推奨適用:5% ≤ n/N < 10%
- 任意適用:n/N < 5%(効果は僅か)
- 計算負荷:現代的な統計ソフトでは自動適用