標本調査問題7 - 青の統計学-DS Playground-

タイトルをここにレベル1

問題はここに

解説

解答と解説を表示

層化抽出における最適配分（Neyman配分）

この問題では、分散を最小化する最適な標本配分であるNeyman配分を計算します。Neyman配分は、各層の構成比と標準偏差の両方を考慮した配分方法です。

問題設定の整理

第1層：構成比W₁ = 0.2、標準偏差σ₁ = 6
第2層：構成比W₂ = 0.5、標準偏差σ₂ = 12
第3層：構成比W₃ = 0.3、標準偏差σ₃ = 18
総標本サイズ：n = 180
目標：分散最小化のための各層の標本サイズ決定

Step 1: Neyman配分の基本原理

Neyman配分では、各層の標本サイズは以下の比率で配分されます：

$$n_h \propto W_h \sigma_h$$

ここで：

$n_h$：第h層の標本サイズ
$W_h$：第h層の構成比
$\sigma_h$：第h層の標準偏差

この配分により、層化抽出の分散が最小化されます。

Step 2: 各層の配分係数の計算

各層について$W_h \sigma_h$を計算：

$$W_1 \sigma_1 = 0.2 \times 6 = 1.2$$

$$W_2 \sigma_2 = 0.5 \times 12 = 6.0$$

$$W_3 \sigma_3 = 0.3 \times 18 = 5.4$$

配分係数の合計：

$$\sum W_h \sigma_h = 1.2 + 6.0 + 5.4 = 12.6$$

Step 3: 各層の標本サイズの計算

Neyman配分による各層の標本サイズ：

$$n_h = n \times \frac{W_h \sigma_h}{\sum W_k \sigma_k}$$

第1層の標本サイズ：

$$n_1 = 180 \times \frac{1.2}{12.6} = 180 \times \frac{1.2}{12.6} = 180 \times 0.0952 = 17.14$$

整数に丸めて：n₁ = 18

Step 4: 他の層の標本サイズも確認

第2層の標本サイズ：

$$n_2 = 180 \times \frac{6.0}{12.6} = 180 \times 0.4762 = 85.71 ≈ 86$$

第3層の標本サイズ：

$$n_3 = 180 \times \frac{5.4}{12.6} = 180 \times 0.4286 = 77.14 ≈ 76$$

確認：18 + 86 + 76 = 180 ✓

Neyman配分の結果

層	構成比	標準偏差	W×σ	配分比率	標本サイズ
第1層	20%	6	1.2	9.5%	18
第2層	50%	12	6.0	47.6%	86
第3層	30%	18	5.4	42.9%	76
合計	100%	-	12.6	100%	180

Step 5: 配分方法の比較

異なる配分方法での結果を比較してみましょう：

配分方法の比較

配分方法	第1層	第2層	第3層	特徴
比例配分	36	90	54	構成比に比例
Neyman配分	18	86	76	分散最小化
均等配分	60	60	60	管理が簡単

Step 6: Neyman配分の特徴

Neyman配分の特徴を理解しましょう：

標準偏差が大きい層により多く配分：第3層（σ=18）が最も多い
構成比も考慮：構成比が小さくても、標準偏差が大きければある程度配分
効率性：他のどの配分方法よりも分散が小さくなる

配分の直感的理解

なぜこの配分が最適なのか：

変動の大きい層から多く抽出：情報量を最大化
構成比の調整：母集団での重要度も反映
効率的な情報収集：限られた標本で最大の精度

理論的背景

Step 7: 分散最小化の数学的証明

Neyman配分の分散は以下で表されます：

$$V_{Neyman} = \frac{1}{n} \left( \sum W_h \sigma_h \right)^2$$

今回の場合：

$$V_{Neyman} = \frac{1}{180} \times (12.6)^2 = \frac{158.76}{180} = 0.882$$

比例配分の場合の分散：

$$V_{proportional} = \frac{1}{n} \sum W_h \sigma_h^2$$

$$V_{proportional} = \frac{1}{180} \times (0.2 \times 36 + 0.5 \times 144 + 0.3 \times 324)$$

$$V_{proportional} = \frac{1}{180} \times (7.2 + 72 + 97.2) = \frac{176.4}{180} = 0.980$$

効率の改善：$(0.980 - 0.882) / 0.980 = 10.0\%$ の分散減少

効率性の比較

配分方法	分散	標準誤差	効率比	改善率
比例配分	0.980	0.990	1.00	-
Neyman配分	0.882	0.939	1.11	10.0%
均等配分	1.176	1.085	0.83	-20.0%

Step 8: 実際の調査での考慮事項

理論的には最適でも、実務では以下を考慮する必要があります：

最小標本サイズ：各層で信頼できる推定に必要な最小サイズ
調査コスト：層によって調査コストが異なる場合
管理の複雑さ：複雑な配分は現場での管理が困難
事前情報の精度：標準偏差の推定値が不正確な場合のリスク

実務的な配分の調整

考慮事項	理論値	調整後	理由
最小サイズ制約	18	25	統計的信頼性確保
コスト制約	76	60	第3層の調査コスト高
管理効率	18-86-76	30-80-70	現場管理の簡素化

応用例と実際の活用

Step 9: 様々な調査での応用

Neyman配分が特に有効な調査例：

調査分野別の応用

調査分野	層化基準	特徴	効果
所得調査	職業分類	高所得層の変動大	15-25%改善
健康調査	年齢・地域	高齢者の変動大	10-20%改善
消費調査	世帯規模	大世帯の変動大	20-30%改善
企業調査	業種・規模	大企業の変動大	25-40%改善

Step 10: 多変量の場合への拡張

複数の変数を同時に調査する場合：

主要変数の選択：最も重要な変数でNeyman配分を計算
妥協配分：複数変数の配分を平均化
優先順位付け：変数ごとに重み付けした配分

計算の要点

Neyman配分の計算手順：

各層の$W_h \sigma_h$を計算
合計$\sum W_h \sigma_h$を求める
各層の配分比率$\frac{W_h \sigma_h}{\sum W_k \sigma_k}$を計算
総標本サイズを配分比率で配分
必要に応じて整数に調整

まとめ

Neyman配分は、統計理論に基づく最適な標本配分方法です。標準偏差の大きい層により多くの標本を配分することで、全体の推定精度を最大化します。実際の調査では、理論的最適解と実務的制約のバランスを取りながら適用することが重要です。

標本調査法