正規分布の分布収束と標準化
分布収束は漸近理論の基本概念の一つで、特に正規分布の場合には厳密な性質を持ちます。統計的推論の基礎となる重要な概念です。
分布収束の意味
分布収束:確率変数列{Xₙ}が確率変数Xに分布収束するとは、すべての連続点xでFₙ(x) → F(x)が成立すること
Step 1: 問題設定の確認
- 母集団分布:X ~ N(μ = 0, σ² = 4)
- 標本サイズ:n(一般),特に n = 25
- 統計量:Tₙ = (X̄ₙ - μ)/(σ/√n)
- 標準偏差:σ = √4 = 2
Step 2: 標本平均の分布
正規分布からの独立標本の場合、標本平均X̄ₙは:
$$\bar{X}_n \sim N\left(\mu, \frac{\sigma^2}{n}\right) = N\left(0, \frac{4}{n}\right)$$
これは正確な分布(漸近分布ではない)です。
Step 3: 統計量Tₙの分布
統計量Tₙを変形すると:
$$T_n = \frac{\bar{X}_n - \mu}{\sigma/\sqrt{n}} = \frac{\bar{X}_n - 0}{2/\sqrt{n}} = \frac{\sqrt{n} \cdot \bar{X}_n}{2}$$
X̄ₙ ~ N(0, 4/n)なので:
$$T_n = \frac{\sqrt{n} \cdot \bar{X}_n}{2} \sim N\left(0, \frac{n \cdot (4/n)}{4}\right) = N(0, 1)$$
Step 4: 分布収束の証明
正規分布の場合、実際にはすべてのnに対して:
$$T_n \sim N(0, 1)$$
したがって、分布収束ではなく分布の等しさが成立:
$$T_n \xrightarrow{d} N(0, 1) \quad \text{(すべてのnで厳密に成立)}$$
正規分布の特殊性
正規分布の場合、標本平均の標準化は:
- 厳密分布:すべてのnで正確にN(0,1)
- 漸近性不要:中心極限定理に依存しない
- 有限標本性質:nの大きさに関係なく成立
Step 5: n = 25の場合の計算
n = 25の場合:
$$T_{25} = \frac{\bar{X}_{25} - 0}{2/\sqrt{25}} = \frac{\bar{X}_{25}}{2/5} = \frac{5\bar{X}_{25}}{2}$$
T₂₅ ~ N(0, 1)なので:
$$P(|T_{25}| > 1.96) = P(T_{25} > 1.96) + P(T_{25} < -1.96)$$
$$= 2 \times P(T_{25} > 1.96) = 2 \times [1 - \Phi(1.96)]$$
標準正規分布において:
$$\Phi(1.96) = 0.9750$$
したがって:
$$P(|T_{25}| > 1.96) = 2 \times (1 - 0.9750) = 2 \times 0.0250 = 0.0500$$
小数第4位まで:0.0500
計算の確認
標準正規分布のクリティカルポイント:
値 | Φ(値) | 1-Φ(値) | 2×[1-Φ(値)] |
---|
1.645 | 0.9500 | 0.0500 | 0.1000 |
1.960 | 0.9750 | 0.0250 | 0.0500 |
2.576 | 0.9950 | 0.0050 | 0.0100 |
中心極限定理との関係
Step 6: 一般的な分布の場合
一般の分布の場合、中心極限定理により:
$$\frac{\bar{X}_n - \mu}{\sigma/\sqrt{n}} \xrightarrow{d} N(0, 1)$$
正規分布は特別で、この収束が即座に(n=1から)成立します。
CLTとの比較
母集団分布 | 標準化の分布 | 収束の性質 |
---|
正規分布 | 厳密にN(0,1) | 即座に成立 |
一様分布 | 近似的にN(0,1) | nが大きいとき |
指数分布 | 近似的にN(0,1) | nが大きいとき |
ベルヌーイ分布 | 近似的にN(0,1) | nが大きいとき |
統計的推論への応用
Step 7: 信頼区間の構築
95%信頼区間:
$$P\left(-1.96 \leq \frac{\bar{X}_n - \mu}{\sigma/\sqrt{n}} \leq 1.96\right) = 0.95$$
これを μ について解くと:
$$P\left(\bar{X}_n - 1.96 \times \frac{\sigma}{\sqrt{n}} \leq \mu \leq \bar{X}_n + 1.96 \times \frac{\sigma}{\sqrt{n}}\right) = 0.95$$
n = 25, σ = 2の場合:
$$\text{信頼区間} = \bar{X}_{25} \pm 1.96 \times \frac{2}{5} = \bar{X}_{25} \pm 0.784$$
Step 8: 仮説検定への応用
帰無仮説 H₀: μ = μ₀ に対する検定統計量:
$$T = \frac{\bar{X}_n - \mu_0}{\sigma/\sqrt{n}} \sim N(0, 1)$$
有意水準α = 0.05の両側検定:
- 棄却域:|T| > 1.96
- 棄却確率:P(|T| > 1.96) = 0.05
検定の性質
正規分布の場合の利点:
- 厳密な有意水準:近似ではなく厳密
- 小標本でも有効:nの大きさに依存しない
- 最適性:一様最強力検定となる
分布収束の理論的背景
Step 9: 分布収束の定義
確率変数列{Xₙ}が確率変数Xに分布収束する:
$$X_n \xrightarrow{d} X \iff F_n(t) \to F(t)$$
すべての連続点tで成立。
標準化の場合:
$$F_n(t) = P(T_n \leq t) = P\left(\frac{\bar{X}_n - \mu}{\sigma/\sqrt{n}} \leq t\right)$$
正規分布の場合、すべてのnに対してFₙ(t) = Φ(t)。
収束の階層
確率論における収束の強さ:
$$\text{概収束} \Rightarrow \text{確率収束} \Rightarrow \text{分布収束}$$
正規分布の場合、分布の等しさ(最強の条件)が成立。
数値例による確認
Step 10: シミュレーション検証
N(0, 4)からの標本サイズn = 25でのシミュレーション:
統計量 | 理論値 | シミュレーション値 | 誤差 |
---|
平均 | 0.000 | -0.002 | 0.002 |
分散 | 1.000 | 0.998 | 0.002 |
P(|T|>1.96) | 0.0500 | 0.0495 | 0.0005 |
理論値とシミュレーション値が良く一致しています。
実用的な応用
Step 11: 品質管理への応用
製造工程で正規分布に従う測定値:
- 管理限界:μ ± 1.96σ/√n
- 異常検出:P(|T| > 1.96) = 0.05
- 工程能力:Cpk指数の計算
実際の計算例
n = 25, σ = 2の管理図:
- 中心線:μ = 0
- 管理限界:±1.96 × 2/5 = ±0.784
- 警告限界:±1.645 × 2/5 = ±0.658
異なる標本サイズでの比較
Step 12: 標本サイズの影響
n | 標準誤差 | 95%信頼区間の幅 | P(|T|>1.96) |
---|
9 | 2/3 = 0.667 | ±1.307 | 0.0500 |
25 | 2/5 = 0.400 | ±0.784 | 0.0500 |
100 | 2/10 = 0.200 | ±0.392 | 0.0500 |
確率は変わらないが、推定精度が向上します。