標本調査法

層化抽出、集落抽出、系統抽出、ネイマン配分など、統計検定準1級レベルの標本調査法を学習します。

タイトルをここに レベル1

問題はここに

解説
解答と解説を表示

有限母集団修正係数の計算

この問題では、母集団サイズが有限の場合に必要となる有限母集団修正係数(finite population correction, FPC)の計算を学習します。統計検定でも頻出の基本的な概念です。

問題設定の整理
  • 母集団サイズ:N = 2000
  • 標本サイズ:n = 300
  • 抽出方法:単純無作為抽出
  • 求めるもの:有限母集団修正係数

Step 1: 有限母集団修正係数の定義

有限母集団修正係数は以下の式で定義されます:

$$\text{FPC} = \sqrt{\frac{N-n}{N-1}}$$

この係数は、有限母集団からの非復元抽出において、標本平均の分散を正しく求めるために使用されます。

Step 2: 抽出率の計算

まず、抽出率(sampling fraction)を計算します:

$$f = \frac{n}{N} = \frac{300}{2000} = 0.15 = 15\%$$

抽出率が高い(一般的に5%以上)場合、有限母集団修正が重要になります。

Step 3: 有限母集団修正係数の計算

定義式に値を代入:

$$\text{FPC} = \sqrt{\frac{N-n}{N-1}} = \sqrt{\frac{2000-300}{2000-1}}$$
$$= \sqrt{\frac{1700}{1999}} = \sqrt{0.8504} = 0.9222$$

小数第3位まで:0.922

しかし、計算を再確認します:

$$\frac{1700}{1999} = 0.85043...$$
$$\sqrt{0.85043} = 0.92220...$$

四捨五入して小数第3位まで:0.922

計算の検証

別の方法で検証:

$$1 - f = 1 - 0.15 = 0.85$$
$$\sqrt{0.85} = 0.9220...$$

近似的に一致しており、計算が正しいことがわかります。

有限母集団修正の意味

Step 4: 標本平均の分散への影響

無限母集団の場合の標本平均の分散:

$$V(\bar{X}) = \frac{\sigma^2}{n}$$

有限母集団の場合(非復元抽出):

$$V(\bar{X}) = \frac{\sigma^2}{n} \times \frac{N-n}{N-1}$$

つまり、有限母集団修正係数の二乗が分散を調整する因子となります。

Step 5: 修正効果の評価

修正による分散の変化:

$$\text{修正効果} = \frac{N-n}{N-1} = \frac{1700}{1999} = 0.8504$$

つまり、分散は約85%に減少(精度が向上)します。

抽出率と修正効果の関係

抽出率修正係数分散倍率修正の必要性
1%0.9950.99不要
5%0.9750.95考慮推奨
15%0.9220.85必要
30%0.8370.70必須

実際の応用例

Step 6: 信頼区間への影響

修正前の標準誤差:

$$SE = \frac{s}{\sqrt{n}}$$

修正後の標準誤差:

$$SE_{修正} = \frac{s}{\sqrt{n}} \times \sqrt{\frac{N-n}{N-1}} = \frac{s}{\sqrt{n}} \times 0.922$$

信頼区間の幅は約92%に縮小されます。

Step 7: 具体例での比較

標本標準偏差s = 100とすると:

  • 修正前SE:$\frac{100}{\sqrt{300}} = 5.77$
  • 修正後SE:$5.77 \times 0.922 = 5.32$
  • 改善率:約8%の精度向上

有限母集団修正が重要な場面

調査例母集団標本抽出率
企業調査1000社200社20%
学校調査500校100校20%
病院調査300院60院20%
小地域調査50市町村20市町村40%

理論的背景

Step 8: 数学的導出

非復元抽出における分散の導出:

標本平均 $\bar{X} = \frac{1}{n}\sum_{i=1}^n X_i$ について、

$$V(\bar{X}) = V\left(\frac{1}{n}\sum_{i=1}^n X_i\right)$$

非復元抽出では標本間に負の相関が生じるため:

$$V(\bar{X}) = \frac{\sigma^2}{n} \times \frac{N-n}{N-1}$$

Step 9: 近似公式

Nが大きい場合の近似:

$$\text{FPC} \approx \sqrt{1-f} = \sqrt{1-\frac{n}{N}}$$

今回の場合:

$$\sqrt{1-0.15} = \sqrt{0.85} = 0.9220$$

正確な値0.9222とほぼ一致します。

実務での判断基準

  • 抽出率 < 5%:修正不要(影響軽微)
  • 5% ≤ 抽出率 < 10%:修正推奨
  • 抽出率 ≥ 10%:修正必須

今回は抽出率15%なので、修正が必須です。

統計ソフトウェアでの実装

Step 10: 主要ソフトでの設定

  • R:survey パッケージで fpc 引数を指定
  • SAS:PROC SURVEYMEANS で TOTAL= オプション
  • SPSS:Complex Samples で母集団サイズを指定
  • Stata:svyset コマンドで fpc() オプション

Step 11: 層化抽出での応用

層化抽出の場合、各層で個別に修正:

$$\text{FPC}_h = \sqrt{\frac{N_h - n_h}{N_h - 1}}$$

ここで、hは層を表します。

注意すべきポイント

  • 復元抽出:修正不要(理論上無限母集団と同等)
  • 多段抽出:各段階で個別に修正考慮
  • 欠測値:実際の回答数で修正計算
  • 重み調整:修正後の分散に重みの影響を追加考慮

応用問題への展開

Step 12: 必要標本サイズの修正

有限母集団での必要標本サイズは:

$$n = \frac{n_0}{1 + \frac{n_0 - 1}{N}}$$

ここで、$n_0$は無限母集団での必要標本サイズです。

Step 13: 実際の精度評価

今回の設定での95%信頼区間の半幅:

$$\text{誤差幅} = 1.96 \times \frac{s}{\sqrt{n}} \times \text{FPC}$$
$$= 1.96 \times \frac{s}{\sqrt{300}} \times 0.922$$
$$= 1.96 \times 0.0577s \times 0.922 = 0.104s$$

修正により誤差幅が約8%縮小されます。

今回の計算結果の総括

  • 有限母集団修正係数:0.922
  • 分散削減効果:約15%の精度向上
  • 抽出率:15%(修正必須レベル)
  • 実用性:中規模調査でよく遭遇する典型例
問題 1/10