標本調査法

層化抽出、集落抽出、系統抽出、ネイマン配分など、統計検定準1級レベルの標本調査法を学習します。

タイトルをここに レベル1

問題はここに

解説
解答と解説を表示

二段抽出における標本配分と抽出率計算

この問題では、複雑な母集団構造に対応する多段抽出の基本的な計算を学習します。実際の大規模調査で広く使用される重要な手法です。

問題設定の整理
  • 第一次単位数:M = 50
  • 第二次単位数:各単位にN = 20
  • 母集団総数:50 × 20 = 1000
  • 第一段抽出数:m = 10
  • 第二段抽出数:各単位からn = 5

Step 1: 総標本サイズの計算

二段抽出における総標本サイズは:

$$\text{総標本サイズ} = m \times n$$

ここで:

  • m:第一段で抽出される第一次単位数
  • n:各第一次単位から抽出される第二次単位数
$$\text{総標本サイズ} = 10 \times 5 = 50$$

したがって、総標本サイズは50です。

Step 2: 全体抽出率の計算

全体の抽出率は:

$$\text{抽出率} = \frac{\text{総標本サイズ}}{\text{母集団総数}} = \frac{50}{1000} = 0.050$$

または、段階別抽出率の積として:

$$\text{抽出率} = \frac{m}{M} \times \frac{n}{N} = \frac{10}{50} \times \frac{5}{20} = 0.2 \times 0.25 = 0.050$$

小数第3位まで:0.050

二段抽出の構造

段階抽出対象抽出率標本数
第一段第一次単位10/50 = 0.210単位
第二段第二次単位5/20 = 0.25各単位から5個
全体最終要素0.2 × 0.25 = 0.0550個

二段抽出の効率性分析

Step 3: 設計効果の概算

二段抽出の設計効果は以下の要因に依存:

$$\text{deff} \approx 1 + (n-1)\rho$$

ここで、ρは第一次単位内相関係数です。

n = 5なので:

$$\text{deff} \approx 1 + 4\rho$$

例えば、ρ = 0.1の場合:deff ≈ 1.4

抽出率の組み合わせ効果

同じ総標本サイズ50でも、配分方法により効率が変化:

第一段(m)第二段(n)総標本数設計効果(ρ=0.1)
510501.9
105501.4
252501.1

Step 4: 最適配分の考え方

固定費用の下での最適配分は:

$$\frac{m}{M} = \sqrt{\frac{C_2 \sigma_w^2}{C_1 \sigma_b^2}}$$

ここで:

  • C₁:第一段の単位費用
  • C₂:第二段の単位費用
  • σ²_b:第一次単位間分散
  • σ²_w:第一次単位内分散

実際の調査での配分決定要因

要因第一段重視第二段重視
移動費用高い低い
管理コスト第一段多め第二段多め
集落内相関低い高い
精度要求第一段多めバランス型

実務における二段抽出の応用

Step 5: 典型的な適用例

  • 全国調査:都道府県→市区町村→個人
  • 学校調査:学校→クラス→生徒
  • 企業調査:産業→企業→従業員
  • 医療調査:病院→診療科→患者

Step 6: 重み付けの必要性

二段抽出では、分析時に適切な重み付けが必要:

$$w_i = \frac{1}{\text{抽出確率}} = \frac{M \times N}{m \times n}$$

今回の場合:

$$w_i = \frac{50 \times 20}{10 \times 5} = \frac{1000}{50} = 20$$

各標本は母集団の20人を代表します。

分散推定の複雑性

二段抽出では、分散推定に特別な配慮が必要:

  • 第一段分散:第一次単位間の変動
  • 第二段分散:第一次単位内の変動
  • 複合分散:両段階の効果を統合
  • 有限母集団修正:各段階で個別に適用

調査設計の実践的考慮事項

Step 7: 代替設計との比較

同等の費用での他の設計:

  • 単純無作為抽出:50人(設計効果 = 1.0)
  • 層化抽出:各層から適切配分(設計効果 < 1.0)
  • 集落抽出:少数集落の全数調査(設計効果 > 1.0)

Step 8: 品質管理の要点

  • 第一段抽出:完全な第一次単位リストの確保
  • 第二段抽出:選ばれた単位内での正確な抽出
  • 代替手法:欠測時の代替単位選択規則
  • 重み調整:無回答に対する事後調整

今回の問題の総括

  • 総標本サイズ:50個(確認済み)
  • 全体抽出率:0.050 = 5%
  • 代表性:各標本が20人を代表
  • 効率性:第一次単位内相関に依存
問題 1/10