大数の法則(Law of Large Numbers)の理論と応用
大数の法則は確率論の基礎的定理で、標本平均が母集団平均に収束することを示します。統計学の実証的基盤を提供する重要な定理です。
大数の法則の意義
理論的基盤:確率の頻度解釈の数学的根拠を提供します。実用的重要性:標本サイズを大きくすることで推定精度が向上することを保証します。
Step 1: 問題設定の確認
ベルヌーイ分布 B(1, p=0.3):
- 期待値:E[Xᵢ] = p = 0.3
- 分散:Var(Xᵢ) = p(1-p) = 0.3 × 0.7 = 0.21
- 標本サイズ:n = 1000
標本平均:X̄ₙ = (X₁ + X₂ + ... + Xₙ)/n
標本平均の性質
| 統計量 | 値 | 計算 |
|---|
| 期待値 | 0.3 | E[X̄ₙ] = E[Xᵢ] = 0.3 |
| 分散 | 0.00021 | Var(X̄ₙ) = Var(Xᵢ)/n = 0.21/1000 |
| 標準偏差 | 0.0145 | SD(X̄ₙ) = √(0.21/1000) |
Step 2: チェビシェフの不等式の適用
チェビシェフの不等式:任意の確率変数Yと定数k > 0に対して
$P(|Y - E[Y]| \geq k) \leq \frac{Var(Y)}{k^2}$
本問では:
- Y = X̄ₙ
- E[Y] = 0.3
- k = 0.05
- Var(Y) = 0.21/1000 = 0.00021
$P(|\bar{X}_n - 0.3| > 0.05) \leq \frac{0.00021}{(0.05)^2} = \frac{0.00021}{0.0025} = 0.084$
Step 3: 計算の詳細
分子の計算:
$Var(\bar{X}_n) = \frac{Var(X_i)}{n} = \frac{p(1-p)}{n} = \frac{0.3 \times 0.7}{1000} = \frac{0.21}{1000} = 0.00021$
分母の計算:
$k^2 = (0.05)^2 = 0.0025$
不等式の上界:
$\frac{0.00021}{0.0025} = \frac{21 \times 10^{-5}}{25 \times 10^{-4}} = \frac{21}{25 \times 10} = \frac{21}{250} = 0.084$
小数第3位まで:0.084
大数の法則の種類
| 法則 | 収束の種類 | 条件 | 強さ |
|---|
| 弱法則 | 確率収束 | 有限分散 | 弱 |
| 強法則 | 概収束 | 有限期待値 | 強 |
| Kolmogorov | 概収束 | 独立同分布 | 最強 |
Step 4: 結果の解釈
チェビシェフの不等式により:
- 上界:P(|X̄ₙ - 0.3| > 0.05) ≤ 0.084
- 意味:標本平均が真の値から0.05以上離れる確率は最大8.4%
- 実際の確率:通常はこの上界よりもずっと小さい
より精密な確率の計算
Step 5: 正規近似による比較
n = 1000は十分大きいので、中心極限定理により:
$\bar{X}_n \sim N\left(0.3, \frac{0.21}{1000}\right) = N(0.3, 0.00021)$
標準化:
$Z = \frac{\bar{X}_n - 0.3}{\sqrt{0.00021}} = \frac{\bar{X}_n - 0.3}{0.0145}$
正規近似による確率:
$P(|\bar{X}_n - 0.3| > 0.05) = P\left(|Z| > \frac{0.05}{0.0145}\right) = P(|Z| > 3.45) \approx 0.0006$
これはチェビシェフの上界0.084よりもずっと小さい値です。
収束の速度比較
| 手法 | 確率の値 | 精度 | 適用条件 |
|---|
| チェビシェフ不等式 | ≤ 0.084 | 粗い上界 | 分布によらない |
| 正規近似 | ≈ 0.0006 | 高精度 | CLT条件 |
| ベルヌーイ厳密解 | ≈ 0.0005 | 厳密 | 分布特定 |
サンプルサイズと精度の関係
Step 6: サンプルサイズの効果
チェビシェフ不等式の上界がnに与える影響:
$P(|\bar{X}_n - \mu| > \epsilon) \leq \frac{\sigma^2}{n\epsilon^2}$
| サンプルサイズ | 上界値 | 改善比 |
|---|
| 100 | 0.84 | 基準 |
| 400 | 0.21 | 4倍改善 |
| 1000 | 0.084 | 10倍改善 |
| 2500 | 0.0336 | 25倍改善 |
サンプルサイズをk倍にすると、上界は1/k倍になります。
ベルヌーイ分布での特殊性
Step 7: ベルヌーイ分布の性質
ベルヌーイ分布B(1, p)では:
- 分散:Var(X) = p(1-p) ≤ 1/4(p = 0.5で最大)
- 本例:p = 0.3なので分散は0.21
- 最大分散の場合:p = 0.5なら分散は0.25
$最大上界 = \frac{0.25}{1000 \times (0.05)^2} = \frac{0.25}{2.5} = 0.1$
p = 0.3の場合の上界0.084は、この最大値より小さくなっています。
チェビシェフ不等式の限界と改良
| 手法 | 特徴 | 上界の質 | 適用範囲 |
|---|
| チェビシェフ | 分布自由 | 粗い | 全分布 |
| Cantelli | 片側版 | やや改善 | 全分布 |
| Hoeffding | 有界変数 | 指数的減衰 | 有界分布 |
| Bernstein | 準ガウス | 高精度 | 軽尾分布 |
実用的な誤差制御
Step 8: 必要サンプルサイズの設計
誤差εと信頼度1-αに対して、必要なサンプルサイズは:
$n \geq \frac{p(1-p)}{\alpha \epsilon^2}$
本例で95%信頼度(α = 0.05)、誤差0.05を保証するには:
$n \geq \frac{0.21}{0.05 \times (0.05)^2} = \frac{0.21}{0.000125} = 1680$
実際のn = 1000では若干不足していることがわかります。