標本サイズの決定は、統計的推定の精度を事前に設計するプロセスです。
必要標本サイズの基本概念
統計的推定における標本サイズは、推定精度(許容誤差)と信頼水準のバランスで決まります。
母平均の信頼区間と許容誤差
95%信頼区間の半幅(許容誤差E):
$E = z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}$
ここで:
- E: 許容誤差(confidence interval half-width)
- z_{α/2}: 信頼水準に対応する標準正規分布の上側α/2点
- σ: 母標準偏差
- n: 標本サイズ
標本サイズ決定の公式
Eに関してnを解く:
$n = \left(\frac{z_{\alpha/2} \cdot \sigma}{E}\right)^2$
与えられた値での計算
条件:
- 母標準偏差 σ = 12
- 許容誤差 E = 3
- 95%信頼水準:z_{0.025} = 1.96
計算過程:
$n = \left(\frac{1.96 \times 12}{3}\right)^2$
$= \left(\frac{23.52}{3}\right)^2$
$= (7.84)^2$
$= 61.4656$
整数への切り上げ:
標本サイズは整数でなければならず、必要な精度を保証するため切り上げます:
$n = \lceil 61.4656 \rceil = 62$
標本サイズ設計の実務的考慮
理論的要件:
- 正規性の仮定: 母集団正規または大標本による正規近似
- σ既知: 実務では過去データや予備調査から推定
- 独立性: 標本が互いに独立して抽出される
実務的調整:
- 無回答率: 10-20%程度を見込んで標本サイズを増加
- 層化抽出: 各層で十分な標本数を確保
- 予算制約: コストとのバランスで最適化
- 統計的検出力: 仮説検定も行う場合は検出力分析も必要
信頼水準別の係数:
- 90%信頼水準:z = 1.645
- 95%信頼水準:z = 1.96
- 99%信頼水準:z = 2.576
σが未知の場合はt分布を用いますが、大標本では正規分布で近似可能です。予備調査や過去データからσを推定する際は、やや大きめに見積もると安全です。
したがって、必要な最小標本サイズは62です。