標本調査法

層化抽出、集落抽出、系統抽出、ネイマン配分など、統計検定準1級レベルの標本調査法を学習します。

タイトルをここに レベル1

問題はここに

解説
解答と解説を表示

集落抽出における設計効果の計算

この問題では、集落抽出による効率の低下を定量化する設計効果(design effect)を計算します。集落内相関は調査効率に大きな影響を与える重要な要因です。

問題設定の整理
  • 集落数:30個
  • 集落サイズ:各20人(均等)
  • 母集団総数:600人
  • 抽出集落数:10個
  • 標本サイズ:200人(10×20)
  • 集落内相関係数:ρ = 0.2

Step 1: 設計効果の定義

設計効果(design effect, deff)は、複雑な標本設計の分散と単純無作為抽出の分散の比:

$$\text{deff} = \frac{\text{Var}_{complex}}{\text{Var}_{srs}}$$

集落抽出の場合、単純無作為抽出よりも一般的に効率が悪化(deff > 1)します。

Step 2: 集落抽出の設計効果公式

均等サイズの集落で全数調査を行う場合:

$$\text{deff} = 1 + (m-1)\rho$$

ここで:

  • $m$:集落サイズ(集落内の要素数)
  • $\rho$:集落内相関係数(intracluster correlation)

Step 3: 数値の代入

与えられた値を代入:

$$\text{deff} = 1 + (m-1)\rho = 1 + (20-1) \times 0.2$$
$$\text{deff} = 1 + 19 \times 0.2 = 1 + 3.8 = 4.8$$

小数第3位まで:4.800

Step 4: 結果の解釈

deff = 4.8は、集落抽出により分散が単純無作為抽出の4.8倍になることを意味します。

  • 効率比:1/4.8 = 0.208(約21%の効率)
  • 実効標本サイズ:200/4.8 = 41.7人相当
  • 精度の低下:標準誤差が√4.8 = 2.19倍に増加

集落内相関係数の影響

ρ値設計効果効率比実効標本サイズ
0.01.0100%200人
0.12.934%69人
0.24.821%42人
0.36.715%30人

理論的背景と応用

Step 5: 集落内相関の意味

集落内相関係数ρは以下を表します:

$$\rho = \frac{\sigma_b^2}{\sigma_b^2 + \sigma_w^2}$$

ここで:

  • $\sigma_b^2$:集落間分散
  • $\sigma_w^2$:集落内分散

ρ = 0.2は、総分散の20%が集落間の違いによることを意味します。

集落内相関の典型値

調査項目典型的ρ値設計効果
社会経済地位0.05-0.152.0-3.9
教育達成度0.10-0.252.9-5.8
健康状態0.01-0.101.2-2.9
政治的態度0.02-0.081.4-2.5

Step 6: 費用効率性の考慮

集落抽出は効率が悪化しますが、実際の調査では費用効率性を考慮する必要があります:

  • 移動費用削減:調査員の移動が効率的
  • 管理コスト:集落単位での管理が容易
  • 実査期間:短期間での調査完了
  • 回収率向上:地域密着による協力度向上

最適集落サイズの検討

設計効果を最小化する観点から:

$$\text{deff} = 1 + (m-1)\rho$$

ρが一定のとき、mが小さいほどdeffは小さくなります。

集落サイズmdeff (ρ=0.2)必要集落数総標本数
102.820200
204.810200
306.87210

実際の調査での改善策

Step 7: 設計効果の軽減方法

  • 集落サイズの縮小:より小さな集落の使用
  • 部分抽出:集落内での二次抽出
  • 層化:集落の事前層化
  • 重み付け:事後調整による補正

Step 8: 二段抽出での改善

集落内で一定数のみ抽出する場合:

$$\text{deff} = 1 + \left(\frac{n}{m} - \frac{1}{m}\right)(m-1)\rho$$

ここで、n:集落内抽出数、m:集落サイズ

例えば、各集落から10人抽出する場合:

$$\text{deff} = 1 + \left(\frac{10}{20} - \frac{1}{20}\right)(20-1) \times 0.2$$
$$\text{deff} = 1 + (0.5 - 0.05) \times 19 \times 0.2 = 1 + 0.45 \times 3.8 = 2.71$$

大幅な改善が期待できます。

標本サイズの調整

目標精度を達成するための標本サイズ調整:

$$n_{cluster} = n_{srs} \times \text{deff}$$

単純無作為抽出で100人必要な精度を得るには:

$$n_{cluster} = 100 \times 4.8 = 480\text{人}$$

の集落抽出標本が必要になります。

質的調査での応用

Step 9: 定性調査への拡張

設計効果の概念は定量調査だけでなく、フォーカスグループなどの定性調査でも重要:

  • グループ効果:参加者間の相互作用
  • 地域効果:同一地域からの参加者
  • 社会的望ましさ:集団圧力による回答バイアス
問題 1/10