有限母集団修正係数の計算
この問題では、母集団サイズが有限の場合に必要となる有限母集団修正係数(finite population correction, FPC)の計算を学習します。統計検定でも頻出の基本的な概念です。
問題設定の整理
- 母集団サイズ:N = 2000
- 標本サイズ:n = 300
- 抽出方法:単純無作為抽出
- 求めるもの:有限母集団修正係数
Step 1: 有限母集団修正係数の定義
有限母集団修正係数は以下の式で定義されます:
$$\text{FPC} = \sqrt{\frac{N-n}{N-1}}$$
この係数は、有限母集団からの非復元抽出において、標本平均の分散を正しく求めるために使用されます。
Step 2: 抽出率の計算
まず、抽出率(sampling fraction)を計算します:
$$f = \frac{n}{N} = \frac{300}{2000} = 0.15 = 15\%$$
抽出率が高い(一般的に5%以上)場合、有限母集団修正が重要になります。
Step 3: 有限母集団修正係数の計算
定義式に値を代入:
$$\text{FPC} = \sqrt{\frac{N-n}{N-1}} = \sqrt{\frac{2000-300}{2000-1}}$$
$$= \sqrt{\frac{1700}{1999}} = \sqrt{0.8504} = 0.9222$$
小数第3位まで:0.922
しかし、計算を再確認します:
$$\frac{1700}{1999} = 0.85043...$$
$$\sqrt{0.85043} = 0.92220...$$
四捨五入して小数第3位まで:0.922
計算の検証
別の方法で検証:
$$1 - f = 1 - 0.15 = 0.85$$
$$\sqrt{0.85} = 0.9220...$$
近似的に一致しており、計算が正しいことがわかります。
有限母集団修正の意味
Step 4: 標本平均の分散への影響
無限母集団の場合の標本平均の分散:
$$V(\bar{X}) = \frac{\sigma^2}{n}$$
有限母集団の場合(非復元抽出):
$$V(\bar{X}) = \frac{\sigma^2}{n} \times \frac{N-n}{N-1}$$
つまり、有限母集団修正係数の二乗が分散を調整する因子となります。
Step 5: 修正効果の評価
修正による分散の変化:
$$\text{修正効果} = \frac{N-n}{N-1} = \frac{1700}{1999} = 0.8504$$
つまり、分散は約85%に減少(精度が向上)します。
抽出率と修正効果の関係
抽出率 | 修正係数 | 分散倍率 | 修正の必要性 |
---|
1% | 0.995 | 0.99 | 不要 |
5% | 0.975 | 0.95 | 考慮推奨 |
15% | 0.922 | 0.85 | 必要 |
30% | 0.837 | 0.70 | 必須 |
実際の応用例
Step 6: 信頼区間への影響
修正前の標準誤差:
$$SE = \frac{s}{\sqrt{n}}$$
修正後の標準誤差:
$$SE_{修正} = \frac{s}{\sqrt{n}} \times \sqrt{\frac{N-n}{N-1}} = \frac{s}{\sqrt{n}} \times 0.922$$
信頼区間の幅は約92%に縮小されます。
Step 7: 具体例での比較
標本標準偏差s = 100とすると:
- 修正前SE:$\frac{100}{\sqrt{300}} = 5.77$
- 修正後SE:$5.77 \times 0.922 = 5.32$
- 改善率:約8%の精度向上
有限母集団修正が重要な場面
調査例 | 母集団 | 標本 | 抽出率 |
---|
企業調査 | 1000社 | 200社 | 20% |
学校調査 | 500校 | 100校 | 20% |
病院調査 | 300院 | 60院 | 20% |
小地域調査 | 50市町村 | 20市町村 | 40% |
理論的背景
Step 8: 数学的導出
非復元抽出における分散の導出:
標本平均 $\bar{X} = \frac{1}{n}\sum_{i=1}^n X_i$ について、
$$V(\bar{X}) = V\left(\frac{1}{n}\sum_{i=1}^n X_i\right)$$
非復元抽出では標本間に負の相関が生じるため:
$$V(\bar{X}) = \frac{\sigma^2}{n} \times \frac{N-n}{N-1}$$
Step 9: 近似公式
Nが大きい場合の近似:
$$\text{FPC} \approx \sqrt{1-f} = \sqrt{1-\frac{n}{N}}$$
今回の場合:
$$\sqrt{1-0.15} = \sqrt{0.85} = 0.9220$$
正確な値0.9222とほぼ一致します。
実務での判断基準
- 抽出率 < 5%:修正不要(影響軽微)
- 5% ≤ 抽出率 < 10%:修正推奨
- 抽出率 ≥ 10%:修正必須
今回は抽出率15%なので、修正が必須です。
統計ソフトウェアでの実装
Step 10: 主要ソフトでの設定
- R:survey パッケージで fpc 引数を指定
- SAS:PROC SURVEYMEANS で TOTAL= オプション
- SPSS:Complex Samples で母集団サイズを指定
- Stata:svyset コマンドで fpc() オプション
Step 11: 層化抽出での応用
層化抽出の場合、各層で個別に修正:
$$\text{FPC}_h = \sqrt{\frac{N_h - n_h}{N_h - 1}}$$
ここで、hは層を表します。
注意すべきポイント
- 復元抽出:修正不要(理論上無限母集団と同等)
- 多段抽出:各段階で個別に修正考慮
- 欠測値:実際の回答数で修正計算
- 重み調整:修正後の分散に重みの影響を追加考慮
応用問題への展開
Step 12: 必要標本サイズの修正
有限母集団での必要標本サイズは:
$$n = \frac{n_0}{1 + \frac{n_0 - 1}{N}}$$
ここで、$n_0$は無限母集団での必要標本サイズです。
Step 13: 実際の精度評価
今回の設定での95%信頼区間の半幅:
$$\text{誤差幅} = 1.96 \times \frac{s}{\sqrt{n}} \times \text{FPC}$$
$$= 1.96 \times \frac{s}{\sqrt{300}} \times 0.922$$
$$= 1.96 \times 0.0577s \times 0.922 = 0.104s$$
修正により誤差幅が約8%縮小されます。
今回の計算結果の総括
- 有限母集団修正係数:0.922
- 分散削減効果:約15%の精度向上
- 抽出率:15%(修正必須レベル)
- 実用性:中規模調査でよく遭遇する典型例