標本調査問題8 - 青の統計学-DS Playground-

タイトルをここにレベル1

問題はここに

解説

解答と解説を表示

集落抽出における設計効果の計算

この問題では、集落抽出による効率の低下を定量化する設計効果（design effect）を計算します。集落内相関は調査効率に大きな影響を与える重要な要因です。

問題設定の整理

集落数：30個
集落サイズ：各20人（均等）
母集団総数：600人
抽出集落数：10個
標本サイズ：200人（10×20）
集落内相関係数：ρ = 0.2

Step 1: 設計効果の定義

設計効果（design effect, deff）は、複雑な標本設計の分散と単純無作為抽出の分散の比：

$$\text{deff} = \frac{\text{Var}_{complex}}{\text{Var}_{srs}}$$

集落抽出の場合、単純無作為抽出よりも一般的に効率が悪化（deff > 1）します。

Step 2: 集落抽出の設計効果公式

均等サイズの集落で全数調査を行う場合：

$$\text{deff} = 1 + (m-1)\rho$$

ここで：

$m$：集落サイズ（集落内の要素数）
$\rho$：集落内相関係数（intracluster correlation）

Step 3: 数値の代入

与えられた値を代入：

$$\text{deff} = 1 + (m-1)\rho = 1 + (20-1) \times 0.2$$

$$\text{deff} = 1 + 19 \times 0.2 = 1 + 3.8 = 4.8$$

小数第3位まで：4.800

Step 4: 結果の解釈

deff = 4.8は、集落抽出により分散が単純無作為抽出の4.8倍になることを意味します。

効率比：1/4.8 = 0.208（約21%の効率）
実効標本サイズ：200/4.8 = 41.7人相当
精度の低下：標準誤差が√4.8 = 2.19倍に増加

集落内相関係数の影響

ρ値	設計効果	効率比	実効標本サイズ
0.0	1.0	100%	200人
0.1	2.9	34%	69人
0.2	4.8	21%	42人
0.3	6.7	15%	30人

理論的背景と応用

Step 5: 集落内相関の意味

集落内相関係数ρは以下を表します：

$$\rho = \frac{\sigma_b^2}{\sigma_b^2 + \sigma_w^2}$$

ここで：

$\sigma_b^2$：集落間分散
$\sigma_w^2$：集落内分散

ρ = 0.2は、総分散の20%が集落間の違いによることを意味します。

集落内相関の典型値

調査項目	典型的ρ値	設計効果
社会経済地位	0.05-0.15	2.0-3.9
教育達成度	0.10-0.25	2.9-5.8
健康状態	0.01-0.10	1.2-2.9
政治的態度	0.02-0.08	1.4-2.5

Step 6: 費用効率性の考慮

集落抽出は効率が悪化しますが、実際の調査では費用効率性を考慮する必要があります：

移動費用削減：調査員の移動が効率的
管理コスト：集落単位での管理が容易
実査期間：短期間での調査完了
回収率向上：地域密着による協力度向上

最適集落サイズの検討

設計効果を最小化する観点から：

$$\text{deff} = 1 + (m-1)\rho$$

ρが一定のとき、mが小さいほどdeffは小さくなります。

集落サイズm	deff (ρ=0.2)	必要集落数	総標本数
10	2.8	20	200
20	4.8	10	200
30	6.8	7	210

実際の調査での改善策

Step 7: 設計効果の軽減方法

集落サイズの縮小：より小さな集落の使用
部分抽出：集落内での二次抽出
層化：集落の事前層化
重み付け：事後調整による補正

Step 8: 二段抽出での改善

集落内で一定数のみ抽出する場合：

$$\text{deff} = 1 + \left(\frac{n}{m} - \frac{1}{m}\right)(m-1)\rho$$

ここで、n：集落内抽出数、m：集落サイズ

例えば、各集落から10人抽出する場合：

$$\text{deff} = 1 + \left(\frac{10}{20} - \frac{1}{20}\right)(20-1) \times 0.2$$

$$\text{deff} = 1 + (0.5 - 0.05) \times 19 \times 0.2 = 1 + 0.45 \times 3.8 = 2.71$$

大幅な改善が期待できます。

標本サイズの調整

目標精度を達成するための標本サイズ調整：

$$n_{cluster} = n_{srs} \times \text{deff}$$

単純無作為抽出で100人必要な精度を得るには：

$$n_{cluster} = 100 \times 4.8 = 480\text{人}$$

の集落抽出標本が必要になります。

質的調査での応用

Step 9: 定性調査への拡張

設計効果の概念は定量調査だけでなく、フォーカスグループなどの定性調査でも重要：

グループ効果：参加者間の相互作用
地域効果：同一地域からの参加者
社会的望ましさ：集団圧力による回答バイアス

標本調査法