中心極限定理(Central Limit Theorem)の基本応用
中心極限定理は統計学の最も重要な定理の一つで、標本平均の分布が母集団分布に関係なく正規分布に収束することを示します。実際の統計分析の基盤となる理論です。
中心極限定理の重要性
分布自由性:母集団分布の形に関係なく適用できます。推定・検定の基礎:信頼区間や仮説検定の理論的基盤を提供します。
Step 1: 中心極限定理の確認
母集団:平均 μ = 50、分散 σ² = 25
標本サイズ:n = 100
中心極限定理により、標本平均 X̄ は近似的に正規分布に従います:
$\bar{X} \sim N\left(\mu, \frac{\sigma^2}{n}\right) = N\left(50, \frac{25}{100}\right) = N(50, 0.25)$
Step 2: 標準化変換
X̄ = 51 を標準化します:
$Z = \frac{\bar{X} - \mu}{\sigma/\sqrt{n}} = \frac{\bar{X} - 50}{\sqrt{25}/\sqrt{100}} = \frac{\bar{X} - 50}{5/10} = \frac{\bar{X} - 50}{0.5}$
X̄ = 51 の場合:
$Z = \frac{51 - 50}{0.5} = \frac{1}{0.5} = 2$
Step 3: 確率の計算
$P(\bar{X} > 51) = P\left(Z > 2\right) = 1 - \Phi(2)$
標準正規分布表より:Φ(2) = 0.9772
$P(\bar{X} > 51) = 1 - 0.9772 = 0.0228$
小数第4位まで:0.0228
Step 4: 結果の解釈
- 確率の意味:標本平均が51を超える確率は約2.28%
- 稀な事象:5%未満なので比較的稀な事象
- 実用的意味:母平均50から1以上離れることは珍しい
中心極限定理の詳細
定理の内容:
母集団の分布が何であれ、標本サイズnが十分大きければ:
$\frac{\bar{X} - \mu}{\sigma/\sqrt{n}} \xrightarrow{d} N(0,1)$
| 項目 | 詳細 | 本例 |
|---|
| 標本平均の期待値 | E[X̄] = μ | 50 |
| 標本平均の分散 | Var(X̄) = σ²/n | 25/100 = 0.25 |
| 標準誤差 | SE = σ/√n | 5/10 = 0.5 |
| 近似の精度 | n ≥ 30で良好 | n = 100(十分) |
サンプルサイズの効果
Step 5: サンプルサイズと精度の関係
| サンプルサイズ | 標準誤差 | P(X̄ > 51) | 精度 |
|---|
| 25 | 1.0 | 0.1587 | 低 |
| 100 | 0.5 | 0.0228 | 中 |
| 400 | 0.25 | 0.00003 | 高 |
サンプルサイズが4倍になると、標準誤差は半分になります。
中心極限定理の条件
- 独立性:標本は独立に抽出される
- 同分布:同一の母集団から抽出
- 有限分散:母集団の分散が有限
- 十分な標本サイズ:一般的にn ≥ 30
実際の応用例
品質管理での応用
製品の重量が平均50g、標準偏差5gの場合:
- 100個の標本:平均重量の変動幅を予測
- 工程管理:標本平均が管理限界を超える確率
- 品質保証:出荷前検査での判定基準
Step 6: 母集団分布の影響
中心極限定理の強力さは、母集団分布によらないことです:
| 母集団分布 | 収束速度 | 必要サンプルサイズ |
|---|
| 正規分布 | 即座 | 任意 |
| 対称分布 | 速い | n ≥ 15 |
| 軽度非対称 | 普通 | n ≥ 30 |
| 極度非対称 | 遅い | n ≥ 100 |
信頼区間への応用
Step 7: 95%信頼区間の計算
標本平均の95%信頼区間:
$\bar{X} \pm 1.96 \times \frac{\sigma}{\sqrt{n}} = \bar{X} \pm 1.96 \times 0.5 = \bar{X} \pm 0.98$
もし標本平均が50.5だった場合:
$信頼区間 = [50.5 - 0.98, 50.5 + 0.98] = [49.52, 51.48]$
検定への応用
帰無仮説:H₀: μ = 50
対立仮説:H₁: μ ≠ 50
観測された標本平均が51の場合:
- 検定統計量:Z = 2.0
- p値:2 × 0.0228 = 0.0456
- 判定:5%水準で有意(H₀棄却)
数値例での確認
Step 8: 計算の検証
$P(\bar{X} > 51) = P\left(\frac{\bar{X} - 50}{0.5} > \frac{51 - 50}{0.5}\right) = P(Z > 2)$
標準正規分布の性質:
- P(Z > 1.96) = 0.025
- P(Z > 2.00) = 0.0228
- P(Z > 2.33) = 0.01
計算結果の妥当性が確認できます。