層化抽出、集落抽出、系統抽出、ネイマン配分など、統計検定準1級レベルの標本調査法を学習します。
問題はここに
この問題では、集落抽出による効率の低下を定量化する設計効果(design effect)を計算します。集落内相関は調査効率に大きな影響を与える重要な要因です。
Step 1: 設計効果の定義
設計効果(design effect, deff)は、複雑な標本設計の分散と単純無作為抽出の分散の比:
集落抽出の場合、単純無作為抽出よりも一般的に効率が悪化(deff > 1)します。
Step 2: 集落抽出の設計効果公式
均等サイズの集落で全数調査を行う場合:
ここで:
Step 3: 数値の代入
与えられた値を代入:
小数第3位まで:4.800
Step 4: 結果の解釈
deff = 4.8は、集落抽出により分散が単純無作為抽出の4.8倍になることを意味します。
ρ値 | 設計効果 | 効率比 | 実効標本サイズ |
---|---|---|---|
0.0 | 1.0 | 100% | 200人 |
0.1 | 2.9 | 34% | 69人 |
0.2 | 4.8 | 21% | 42人 |
0.3 | 6.7 | 15% | 30人 |
Step 5: 集落内相関の意味
集落内相関係数ρは以下を表します:
ここで:
ρ = 0.2は、総分散の20%が集落間の違いによることを意味します。
調査項目 | 典型的ρ値 | 設計効果 |
---|---|---|
社会経済地位 | 0.05-0.15 | 2.0-3.9 |
教育達成度 | 0.10-0.25 | 2.9-5.8 |
健康状態 | 0.01-0.10 | 1.2-2.9 |
政治的態度 | 0.02-0.08 | 1.4-2.5 |
Step 6: 費用効率性の考慮
集落抽出は効率が悪化しますが、実際の調査では費用効率性を考慮する必要があります:
設計効果を最小化する観点から:
ρが一定のとき、mが小さいほどdeffは小さくなります。
集落サイズm | deff (ρ=0.2) | 必要集落数 | 総標本数 |
---|---|---|---|
10 | 2.8 | 20 | 200 |
20 | 4.8 | 10 | 200 |
30 | 6.8 | 7 | 210 |
Step 7: 設計効果の軽減方法
Step 8: 二段抽出での改善
集落内で一定数のみ抽出する場合:
ここで、n:集落内抽出数、m:集落サイズ
例えば、各集落から10人抽出する場合:
大幅な改善が期待できます。
目標精度を達成するための標本サイズ調整:
単純無作為抽出で100人必要な精度を得るには:
の集落抽出標本が必要になります。
Step 9: 定性調査への拡張
設計効果の概念は定量調査だけでなく、フォーカスグループなどの定性調査でも重要: