標本調査法

層化抽出、集落抽出、系統抽出、ネイマン配分など、統計検定準1級レベルの標本調査法を学習します。

タイトルをここに レベル1

問題はここに

解説
解答と解説を表示

層化抽出における比例配分の計算

この問題では、母集団を異質な層(stratum)に分割し、各層から標本を抽出する層化抽出法を学習します。比例配分は各層のサイズに比例して標本を配分する最も基本的な方法です。

問題設定の整理
  • 営業部門:N₁ = 300人
  • 技術部門:N₂ = 200人
  • 管理部門:N₃ = 100人
  • 母集団総数:N = 300 + 200 + 100 = 600人
  • 目標標本サイズ:n = 150人
  • 配分方法:比例配分

Step 1: 各層の構成比の計算

各部門の母集団に占める割合:

$$W_1 = \frac{N_1}{N} = \frac{300}{600} = 0.5 \text{(50%)}$$
$$W_2 = \frac{N_2}{N} = \frac{200}{600} = \frac{1}{3} \approx 0.333 \text{(33.3%)}$$
$$W_3 = \frac{N_3}{N} = \frac{100}{600} = \frac{1}{6} \approx 0.167 \text{(16.7%)}$$

Step 2: 比例配分による標本サイズの計算

比例配分では、各層の標本サイズは母集団での構成比に比例します:

$$n_h = n \times W_h = n \times \frac{N_h}{N}$$

各部門の標本サイズ:

$$n_1 = 150 \times \frac{300}{600} = 150 \times 0.5 = 75 \text{人}$$
$$n_2 = 150 \times \frac{200}{600} = 150 \times \frac{1}{3} = 50 \text{人}$$
$$n_3 = 150 \times \frac{100}{600} = 150 \times \frac{1}{6} = 25 \text{人}$$

Step 3: 結果の確認

$$n_1 + n_2 + n_3 = 75 + 50 + 25 = 150$$

✓ 目標標本サイズと一致しています。

したがって、各部門からの抽出数は:営業75人、技術50人、管理25人

層化抽出の利点

利点説明効果
代表性確保各層からの確実な抽出偏りの防止
精度向上層内の同質性活用分散の削減
部分集団分析各層の個別推定詳細分析可能
管理効率組織単位での実施調査の円滑化

比例配分の特徴と応用

Step 4: 比例配分の性質

  • 自己重み付け:各観測値の重みが等しくなる
  • 簡便性:計算が簡単で理解しやすい
  • 無偏性:母集団平均の不偏推定量が得られる
  • 一般性:事前情報が限られても適用可能

標本サイズの端数処理

実際の調査では端数が生じる場合があります:

部門理論値調整後処理方法
営業74.775四捨五入
技術49.850四捨五入
管理24.925四捨五入
合計149.4150調整済み

Step 5: 抽出率の計算

各層の抽出率(sampling fraction):

$$f_1 = \frac{n_1}{N_1} = \frac{75}{300} = 0.25 \text{(25%)}$$
$$f_2 = \frac{n_2}{N_2} = \frac{50}{200} = 0.25 \text{(25%)}$$
$$f_3 = \frac{n_3}{N_3} = \frac{25}{100} = 0.25 \text{(25%)}$$

比例配分では、すべての層で抽出率が等しくなります。

他の配分法との比較

配分法原理特徴適用場面
比例配分層サイズに比例簡便、無偏一般的な調査
ネイマン配分層内分散考慮最適、効率的精度重視
等配分各層同数小層も確保比較分析

実際の調査実施での考慮事項

Step 6: 実務上の調整

  • 最小標本サイズ:小さな層でも統計的分析に必要な最小限の標本
  • 無回答対応:各層での無回答率を考慮した上乗せ
  • 調査効率:各部門での調査実施の実行可能性
  • 費用制約:部門別の調査コストの違い

層化抽出の標準誤差

比例配分による層化抽出の標本平均の分散は:

$$\text{Var}(\bar{x}_{st}) = \frac{1}{n} \sum_{h=1}^L W_h \sigma_h^2 \left(1 - \frac{n_h}{N_h}\right)$$

単純無作為抽出と比較して、通常は分散が小さくなります(効率の向上)。

Step 7: 層化の効果測定

層化の効果は設計効果(design effect)で測定:

$$\text{Deff} = \frac{\text{Var}_{層化}}{\text{Var}_{単純}}$$
  • Deff < 1:層化により効率向上
  • Deff = 1:層化の効果なし
  • Deff > 1:層化により効率悪化(稀)

調査票の設計と分析

Step 8: 分析時の重み付け

比例配分では重み付けは不要ですが、確認のため:

$$w_h = \frac{W_h}{n_h/n} = \frac{N_h/N}{n_h/n} = \frac{N_h \cdot n}{N \cdot n_h}$$

営業部門の重み:

$$w_1 = \frac{300 \times 150}{600 \times 75} = \frac{45000}{45000} = 1.0$$

すべての層で重み = 1.0となり、重み付けが不要であることが確認できます。

問題 1/10