単純無作為抽出におけるサンプルサイズ設計
この問題は、指定された精度を達成するために必要な標本サイズを決定する基本的な設計問題です。調査の計画段階で重要な計算となります。
問題設定の整理
- 母集団標準偏差:σ = 12万円(既知)
- 信頼度:95%
- 要求精度:信頼区間の幅 ≤ 4万円
- 抽出方法:単純無作為抽出
Step 1: 信頼区間の構造
母集団標準偏差既知の場合、母平均μの95%信頼区間は:
$$\bar{X} \pm Z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}$$
ここで:
- $\bar{X}$:標本平均
- $Z_{\alpha/2} = Z_{0.025} = 1.96$:95%信頼区間の臨界値
- $\sigma = 12$:母集団標準偏差
- $n$:標本サイズ(求める値)
Step 2: 信頼区間の幅の計算
信頼区間の幅は:
$$\text{区間幅} = 2 \times Z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}} = 2 \times 1.96 \times \frac{12}{\sqrt{n}}$$
$$\text{区間幅} = \frac{47.04}{\sqrt{n}}$$
Step 3: 要求条件の設定
信頼区間の幅が4万円以下という条件から:
$$\frac{47.04}{\sqrt{n}} \leq 4$$
Step 4: 必要標本サイズの計算
$$\sqrt{n} \geq \frac{47.04}{4} = 11.76$$
$$n \geq (11.76)^2 = 138.3$$
標本サイズは整数である必要があるため:
$$n \geq 139$$
結果の検証
n = 139のときの信頼区間幅:
$$\text{区間幅} = \frac{47.04}{\sqrt{139}} = \frac{47.04}{11.79} \approx 3.99 \text{万円}$$
✓ 要求される4万円以下を満たしています。
Step 5: 一般公式の導出
一般的に、信頼区間の幅をEとするとき、必要標本サイズは:
$$n = \left( \frac{2Z_{\alpha/2}\sigma}{E} \right)^2$$
今回の場合:
$$n = \left( \frac{2 \times 1.96 \times 12}{4} \right)^2 = \left( \frac{47.04}{4} \right)^2 = 138.3$$
したがって、最低139個の標本が必要です。
サンプルサイズ設計の重要ポイント
要因 | 影響 | 考慮事項 |
---|
信頼度↑ | 標本サイズ↑ | Z値が大きくなる |
精度↑ | 標本サイズ↑ | 誤差幅Eが小さくなる |
分散↑ | 標本サイズ↑ | 母集団のばらつきが大きい |
費用制約 | 標本サイズ↓ | 実用的な上限設定 |
実際の調査での考慮事項
Step 6: 実践的な調整
- 無回答率:20%の無回答を想定すると $139 \div 0.8 = 174$個必要
- 有限母集団修正:母集団サイズが小さい場合は修正が必要
- 層化の効果:層化抽出により効率向上の可能性
- 費用対効果:調査コストと精度のバランス
他の信頼度での比較
信頼度 | Z値 | 必要標本サイズ |
---|
90% | 1.645 | 98個 |
95% | 1.960 | 139個 |
99% | 2.576 | 237個 |
標本サイズと精度の関係
標本サイズを2倍にすると、標準誤差は$1/\sqrt{2} \approx 0.707$倍になり、精度は約1.4倍向上します。
$$\text{標準誤差} = \frac{\sigma}{\sqrt{n}} = \frac{12}{\sqrt{139}} \approx 1.02 \text{万円}$$
この標準誤差により、95%信頼区間の半幅は $1.96 \times 1.02 \approx 2.0$万円となります。