層化抽出における比例配分の計算
この問題では、母集団を異質な層(stratum)に分割し、各層から標本を抽出する層化抽出法を学習します。比例配分は各層のサイズに比例して標本を配分する最も基本的な方法です。
問題設定の整理
- 営業部門:N₁ = 300人
- 技術部門:N₂ = 200人
- 管理部門:N₃ = 100人
- 母集団総数:N = 300 + 200 + 100 = 600人
- 目標標本サイズ:n = 150人
- 配分方法:比例配分
Step 1: 各層の構成比の計算
各部門の母集団に占める割合:
$$W_1 = \frac{N_1}{N} = \frac{300}{600} = 0.5 \text{(50%)}$$
$$W_2 = \frac{N_2}{N} = \frac{200}{600} = \frac{1}{3} \approx 0.333 \text{(33.3%)}$$
$$W_3 = \frac{N_3}{N} = \frac{100}{600} = \frac{1}{6} \approx 0.167 \text{(16.7%)}$$
Step 2: 比例配分による標本サイズの計算
比例配分では、各層の標本サイズは母集団での構成比に比例します:
$$n_h = n \times W_h = n \times \frac{N_h}{N}$$
各部門の標本サイズ:
$$n_1 = 150 \times \frac{300}{600} = 150 \times 0.5 = 75 \text{人}$$
$$n_2 = 150 \times \frac{200}{600} = 150 \times \frac{1}{3} = 50 \text{人}$$
$$n_3 = 150 \times \frac{100}{600} = 150 \times \frac{1}{6} = 25 \text{人}$$
Step 3: 結果の確認
$$n_1 + n_2 + n_3 = 75 + 50 + 25 = 150$$
✓ 目標標本サイズと一致しています。
したがって、各部門からの抽出数は:営業75人、技術50人、管理25人
層化抽出の利点
利点 | 説明 | 効果 |
---|
代表性確保 | 各層からの確実な抽出 | 偏りの防止 |
精度向上 | 層内の同質性活用 | 分散の削減 |
部分集団分析 | 各層の個別推定 | 詳細分析可能 |
管理効率 | 組織単位での実施 | 調査の円滑化 |
比例配分の特徴と応用
Step 4: 比例配分の性質
- 自己重み付け:各観測値の重みが等しくなる
- 簡便性:計算が簡単で理解しやすい
- 無偏性:母集団平均の不偏推定量が得られる
- 一般性:事前情報が限られても適用可能
標本サイズの端数処理
実際の調査では端数が生じる場合があります:
部門 | 理論値 | 調整後 | 処理方法 |
---|
営業 | 74.7 | 75 | 四捨五入 |
技術 | 49.8 | 50 | 四捨五入 |
管理 | 24.9 | 25 | 四捨五入 |
合計 | 149.4 | 150 | 調整済み |
Step 5: 抽出率の計算
各層の抽出率(sampling fraction):
$$f_1 = \frac{n_1}{N_1} = \frac{75}{300} = 0.25 \text{(25%)}$$
$$f_2 = \frac{n_2}{N_2} = \frac{50}{200} = 0.25 \text{(25%)}$$
$$f_3 = \frac{n_3}{N_3} = \frac{25}{100} = 0.25 \text{(25%)}$$
比例配分では、すべての層で抽出率が等しくなります。
他の配分法との比較
配分法 | 原理 | 特徴 | 適用場面 |
---|
比例配分 | 層サイズに比例 | 簡便、無偏 | 一般的な調査 |
ネイマン配分 | 層内分散考慮 | 最適、効率的 | 精度重視 |
等配分 | 各層同数 | 小層も確保 | 比較分析 |
実際の調査実施での考慮事項
Step 6: 実務上の調整
- 最小標本サイズ:小さな層でも統計的分析に必要な最小限の標本
- 無回答対応:各層での無回答率を考慮した上乗せ
- 調査効率:各部門での調査実施の実行可能性
- 費用制約:部門別の調査コストの違い
層化抽出の標準誤差
比例配分による層化抽出の標本平均の分散は:
$$\text{Var}(\bar{x}_{st}) = \frac{1}{n} \sum_{h=1}^L W_h \sigma_h^2 \left(1 - \frac{n_h}{N_h}\right)$$
単純無作為抽出と比較して、通常は分散が小さくなります(効率の向上)。
Step 7: 層化の効果測定
層化の効果は設計効果(design effect)で測定:
$$\text{Deff} = \frac{\text{Var}_{層化}}{\text{Var}_{単純}}$$
- Deff < 1:層化により効率向上
- Deff = 1:層化の効果なし
- Deff > 1:層化により効率悪化(稀)
調査票の設計と分析
Step 8: 分析時の重み付け
比例配分では重み付けは不要ですが、確認のため:
$$w_h = \frac{W_h}{n_h/n} = \frac{N_h/N}{n_h/n} = \frac{N_h \cdot n}{N \cdot n_h}$$
営業部門の重み:
$$w_1 = \frac{300 \times 150}{600 \times 75} = \frac{45000}{45000} = 1.0$$
すべての層で重み = 1.0となり、重み付けが不要であることが確認できます。