比推定量による母集団総数の推定
この問題では、補助変数との比を利用して目的変数の母集団総数を効率的に推定する比推定法を学習します。補助情報が利用可能な場合の重要な推定手法です。
問題設定の整理
- 母集団サイズ:N = 2000
- 標本サイズ:n = 100
- 補助変数xの母集団総数:X = 15000
- 補助変数xの標本総数:x = 750
- 目的変数yの標本総数:y = 500
Step 1: 比推定量の定義
比推定量による母集団総数の推定値は:
$\hat{Y}_R = X \cdot \frac{y}{x} = X \cdot R$
ここで:
- $\hat{Y}_R$:比推定量による母集団総数の推定値
- $X$:補助変数の既知の母集団総数
- $R = \frac{y}{x}$:標本における比
Step 2: 標本比の計算
$R = \frac{y}{x} = \frac{500}{750} = \frac{2}{3} = 0.6667$
Step 3: 比推定量の計算
$\hat{Y}_R = X \cdot R = 15000 \times \frac{2}{3} = 15000 \times 0.6667 = 10000$
したがって、比推定量による母集団総数Yの推定値は10000です。
比推定量の理論的背景
比推定量が有効な条件:
- 比例関係:yとxの間に強い正の相関
- 原点通過:回帰直線が原点を通る(またはそれに近い)
- 比一定性:y/xの比が母集団内で安定
- 大標本:標本サイズが十分大きい
Step 5: 比推定量vs単純推定量の効率性
単純推定量(比推定を使わない場合):
$\hat{Y}_{simple} = N \cdot \bar{y} = N \cdot \frac{y}{n} = 2000 \times \frac{500}{100} = 2000 \times 5 = 10000$
この場合、偶然両者が一致していますが、一般的には異なります。
比推定量の相対効率
比推定量が単純推定量より効率的となる条件:
$\rho_{xy} > \frac{1}{2} \cdot \frac{C_x}{C_y}$
ここで:
- $\rho_{xy}$:xとyの相関係数
- $C_x = \frac{S_x}{\bar{X}}$:xの変動係数
- $C_y = \frac{S_y}{\bar{Y}}$:yの変動係数
Step 6: 現在の標本における指標
標本から計算される値:
- xの標本平均:$\bar{x} = \frac{750}{100} = 7.5$
- yの標本平均:$\bar{y} = \frac{500}{100} = 5.0$
- 母集団xの平均:$\bar{X} = \frac{15000}{2000} = 7.5$
- 標本比:$R = \frac{5.0}{7.5} = 0.6667$
標本と母集団でxの平均が一致しているため、この場合は比推定量と単純推定量が同じ値になります。
比推定量の実用性
| 状況 | 適用例 | 効果 |
|---|
| 売上調査 | 従業員数×効率で売上推定 | 高精度 |
| 農業調査 | 面積×収量で総生産推定 | コスト削減 |
| 人口調査 | 世帯数×世帯規模で人口推定 | 迅速性 |
| 在庫調査 | 前年値×成長率で当年推定 | 効率性 |