集落抽出における設計効果の計算
この問題では、集落抽出による効率の低下を定量化する設計効果(design effect)を計算します。集落内相関は調査効率に大きな影響を与える重要な要因です。
問題設定の整理
- 集落数:30個
- 集落サイズ:各20人(均等)
- 母集団総数:600人
- 抽出集落数:10個
- 標本サイズ:200人(10×20)
- 集落内相関係数:ρ = 0.2
Step 1: 設計効果の定義
設計効果(design effect, deff)は、複雑な標本設計の分散と単純無作為抽出の分散の比:
$\text{deff} = \frac{\text{Var}_{complex}}{\text{Var}_{srs}}$
集落抽出の場合、単純無作為抽出よりも一般的に効率が悪化(deff > 1)します。
Step 2: 集落抽出の設計効果公式
均等サイズの集落で全数調査を行う場合:
$\text{deff} = 1 + (m-1)\rho$
ここで:
- $m$:集落サイズ(集落内の要素数)
- $\rho$:集落内相関係数(intracluster correlation)
Step 3: 数値の代入
与えられた値を代入:
$\text{deff} = 1 + (m-1)\rho = 1 + (20-1) \times 0.2$
$\text{deff} = 1 + 19 \times 0.2 = 1 + 3.8 = 4.8$
小数第3位まで:4.800
Step 4: 結果の解釈
deff = 4.8は、集落抽出により分散が単純無作為抽出の4.8倍になることを意味します。
- 効率比:1/4.8 = 0.208(約21%の効率)
- 実効標本サイズ:200/4.8 = 41.7人相当
- 精度の低下:標準誤差が√4.8 = 2.19倍に増加
集落内相関係数の影響
| ρ値 | 設計効果 | 効率比 | 実効標本サイズ |
|---|
| 0.0 | 1.0 | 100% | 200人 |
| 0.1 | 2.9 | 34% | 69人 |
| 0.2 | 4.8 | 21% | 42人 |
| 0.3 | 6.7 | 15% | 30人 |
理論的背景と応用
Step 5: 集落内相関の意味
集落内相関係数ρは以下を表します:
$\rho = \frac{\sigma_b^2}{\sigma_b^2 + \sigma_w^2}$
ここで:
- $\sigma_b^2$:集落間分散
- $\sigma_w^2$:集落内分散
ρ = 0.2は、総分散の20%が集落間の違いによることを意味します。
集落内相関の典型値
| 調査項目 | 典型的ρ値 | 設計効果 |
|---|
| 社会経済地位 | 0.05-0.15 | 2.0-3.9 |
| 教育達成度 | 0.10-0.25 | 2.9-5.8 |
| 健康状態 | 0.01-0.10 | 1.2-2.9 |
| 政治的態度 | 0.02-0.08 | 1.4-2.5 |
Step 6: 費用効率性の考慮
集落抽出は効率が悪化しますが、実際の調査では費用効率性を考慮する必要があります:
- 移動費用削減:調査員の移動が効率的
- 管理コスト:集落単位での管理が容易
- 実査期間:短期間での調査完了
- 回収率向上:地域密着による協力度向上
最適集落サイズの検討
設計効果を最小化する観点から:
$\text{deff} = 1 + (m-1)\rho$
ρが一定のとき、mが小さいほどdeffは小さくなります。
| 集落サイズm | deff (ρ=0.2) | 必要集落数 | 総標本数 |
|---|
| 10 | 2.8 | 20 | 200 |
| 20 | 4.8 | 10 | 200 |
| 30 | 6.8 | 7 | 210 |