層化抽出における標準誤差効率性の基礎
この問題では、各層の標準偏差が異なる場合の抽出効率を、調和平均と算術平均の概念を使って理解します。これは層化抽出の効率性を評価する基礎的なアプローチです。
問題設定の整理
- 第1層:構成比W₁ = 0.4、標準偏差σ₁ = 10
- 第2層:構成比W₂ = 0.6、標準偏差σ₂ = 20
- 抽出方法:各層から同じ標本サイズ
- 評価指標:標準誤差の効率性
Step 1: 標準偏差の算術平均
構成比で重み付けした標準偏差の算術平均:
$\bar{\sigma}_{算術} = W_1 \sigma_1 + W_2 \sigma_2$
$\bar{\sigma}_{算術} = 0.4 \times 10 + 0.6 \times 20 = 4 + 12 = 16$
Step 2: 標準偏差の調和平均
構成比で重み付けした標準偏差の調和平均:
$\bar{\sigma}_{調和} = \frac{1}{\frac{W_1}{\sigma_1} + \frac{W_2}{\sigma_2}}$
分母を計算:
$\frac{W_1}{\sigma_1} + \frac{W_2}{\sigma_2} = \frac{0.4}{10} + \frac{0.6}{20} = 0.04 + 0.03 = 0.07$
調和平均:
$\bar{\sigma}_{調和} = \frac{1}{0.07} = \frac{100}{7} ≈ 14.29$
Step 3: 効率比の計算
調和平均を算術平均で割った値:
$\text{効率比} = \frac{\bar{\sigma}_{調和}}{\bar{\sigma}_{算術}} = \frac{14.29}{16} = 0.893$
小数第2位まで:0.89
調和平均と算術平均の関係
一般的に、正の値に対して:
$\text{調和平均} \leq \text{算術平均}$
等号が成り立つのは、すべての値が等しい場合のみです。
| ケース | σ₁ | σ₂ | 算術平均 | 調和平均 | 効率比 |
|---|
| 同じ値 | 15 | 15 | 15.0 | 15.0 | 1.00 |
| 小さな差 | 12 | 18 | 15.6 | 15.4 | 0.99 |
| 今回の例 | 10 | 20 | 16.0 | 14.3 | 0.89 |
| 大きな差 | 5 | 25 | 17.0 | 8.3 | 0.49 |
Step 4: 結果の統計的意味
効率比0.89は以下を意味します:
- 標準誤差の効率性:調和平均的な効果が算術平均より11%低い
- 分散の違い:各層での抽出効率に差がある
- 最適化の余地:標準偏差の違いを考慮した配分で改善可能
実際の抽出での意味
この効率比は以下の実務的な意味を持ちます:
- 均等抽出の限界:各層から同数抽出することの非効率性
- 最適配分の必要性:標準偏差に応じた配分の重要性
- 精度の予測:期待される推定精度の評価指標
Step 5: 理論的背景
この計算の統計的意味:
- Jensen's不等式:凸関数に対する平均の性質
- 分散の加法性:独立な推定量の分散合成
- 効率性指標:異なる抽出方法の比較基準
応用例
| 調査分野 | 層1の特徴 | 層2の特徴 | 期待効率比 |
|---|
| 所得調査 | 低所得層(小分散) | 高所得層(大分散) | 0.7-0.9 |
| 企業調査 | 中小企業(小分散) | 大企業(大分散) | 0.6-0.8 |
| 地域調査 | 都市部(中分散) | 農村部(大分散) | 0.8-0.9 |
Step 6: 改善策の示唆
効率比が1.0より小さい場合の改善方法:
- 比例配分:構成比に応じた標本配分
- ネイマン配分:標準偏差に比例した配分
- 最適配分:費用と精度を考慮した配分
この基礎的な計算により、標準誤差の違いが抽出効率に与える影響を定量的に理解できます。