大数の弱法則とチェビシェフの不等式
大数の弱法則は確率論の基本定理の一つで、独立同分布確率変数の標本平均が母平均に確率収束することを示します。チェビシェフの不等式はこの収束の速度を定量的に評価する重要な道具です。
大数の弱法則
定理:X₁, X₂, ..., Xₙが独立同分布でE[Xi] = μ, Var(Xi) = σ² < ∞ならば
X̄ₙ →ᴾ μ(確率収束)
Step 1: 問題設定の整理
- 母平均:μ = 2
- 母分散:σ² = 9
- 標本サイズ:n = 100
- 偏差の閾値:ε = 3
- 求める量:P(|X̄ₙ - μ| ≥ 3)の上界
Step 2: 標本平均の分布特性
独立同分布確率変数の標本平均X̄ₙについて:
$$E[\bar{X}_n] = E\left[\frac{1}{n}\sum_{i=1}^{n}X_i\right] = \frac{1}{n}\sum_{i=1}^{n}E[X_i] = \frac{1}{n} \times n \times \mu = \mu$$
$$Var(\bar{X}_n) = Var\left(\frac{1}{n}\sum_{i=1}^{n}X_i\right) = \frac{1}{n^2}Var\left(\sum_{i=1}^{n}X_i\right)$$
独立性により:
$$Var(\bar{X}_n) = \frac{1}{n^2}\sum_{i=1}^{n}Var(X_i) = \frac{1}{n^2} \times n \times \sigma^2 = \frac{\sigma^2}{n}$$
Step 3: チェビシェフの不等式の適用
任意の確率変数Yと定数k > 0に対して:
$$P(|Y - E[Y]| \geq k) \leq \frac{Var(Y)}{k^2}$$
標本平均X̄ₙに適用すると:
$$P(|\bar{X}_n - \mu| \geq \varepsilon) \leq \frac{Var(\bar{X}_n)}{\varepsilon^2} = \frac{\sigma^2/n}{\varepsilon^2} = \frac{\sigma^2}{n\varepsilon^2}$$
Step 4: 数値計算
与えられた値を代入:
- σ² = 9
- n = 100
- ε = 3(標本平均が母平均から3以上離れる)
チェビシェフの不等式に代入:
$$P(|\bar{X}_n - \mu| \geq 3) \leq \frac{\sigma^2}{n\varepsilon^2} = \frac{9}{100 \times 3^2} = \frac{9}{100 \times 9} = \frac{9}{900} = 0.01$$
答え:0.01
計算の確認
チェビシェフの不等式:
$$P(|\bar{X}_n - \mu| \geq \varepsilon) \leq \frac{\sigma^2}{n\varepsilon^2}$$
σ² = 9, n = 100, ε = 3の場合:
$$\frac{9}{100 \times 9} = \frac{9}{900} = 0.01$$
大数の弱法則の意味
Step 5: 確率収束の概念
大数の弱法則は以下を主張します:
$$\lim_{n \to \infty} P(|\bar{X}_n - \mu| \geq \varepsilon) = 0$$
任意のε > 0について成立します。これは標本平均が母平均に確率収束することを意味します。
収束の種類
収束タイプ | 記号 | 定義 | 強さ |
---|
概収束 | → a.s. | P(lim Xₙ = X) = 1 | 最強 |
確率収束 | →ᴾ | P(|Xₙ - X| > ε) → 0 | 中 |
分布収束 | →ᵈ | Fₙ(x) → F(x) | 最弱 |
チェビシェフの不等式の重要性
Step 6: 不等式の一般形
チェビシェフの不等式の一般形:
$$P(|X - E[X]| \geq k\sigma) \leq \frac{1}{k^2}$$
ここでσ = √Var(X)は標準偏差です。
標本平均の場合:
$$P\left(|\bar{X}_n - \mu| \geq k\frac{\sigma}{\sqrt{n}}\right) \leq \frac{1}{k^2}$$
実用的な解釈
k = 2の場合、標本平均が母平均から2標準誤差以上離れる確率は最大25%
k = 3の場合、3標準誤差以上離れる確率は最大11.1%
中心極限定理との関係
Step 7: CLTによる近似
中心極限定理により、nが大きいとき:
$$\sqrt{n}(\bar{X}_n - \mu) \xrightarrow{d} N(0, \sigma^2)$$
したがって:
$$P(|\bar{X}_n - \mu| \geq \varepsilon) \approx 2\Phi\left(-\frac{\varepsilon\sqrt{n}}{\sigma}\right)$$
ε = 3, n = 100, σ = 3の場合:
$$P(|\bar{X}_n - \mu| \geq 3) \approx 2\Phi(-10) \approx 0$$
チェビシェフの上界(0.01)は非常に保守的であることがわかります。
実際の応用例
大数の法則の応用
- 保険業界:大数の法則により保険料を設定
- 品質管理:製品の品質を標本で評価
- 世論調査:標本調査で全体の傾向を推定
- 金融:リスク分散の理論的基礎
強法則との違い
Step 8: 大数の強法則
大数の強法則(Kolmogorov):
$$P\left(\lim_{n \to \infty} \bar{X}_n = \mu\right) = 1$$
これは概収束を主張し、弱法則より強い結果です。
項目 | 弱法則 | 強法則 |
---|
収束タイプ | 確率収束 | 概収束 |
条件 | 有限分散 | より弱い条件 |
証明 | チェビシェフ不等式 | Borel-Cantelli補題 |
歴史的発展
Step 9: 歴史的背景
- 1713年:Bernoulli(最初の大数の法則)
- 1867年:Chebyshev(チェビシェフの不等式)
- 1909年:Borel(強法則の萌芽)
- 1930年:Kolmogorov(現代的な強法則)
現代の発展
- マルチンゲール理論:より一般的な収束定理
- エルゴード理論:時系列への拡張
- 経験過程理論:関数への一般化
実践的な考慮事項
Step 10: サンプルサイズの決定
所望の精度εでの推定を行うために必要なサンプルサイズ:
$$P(|\bar{X}_n - \mu| \geq \varepsilon) \leq \delta$$
チェビシェフの不等式から:
$$n \geq \frac{\sigma^2}{\varepsilon^2 \delta}$$
例:ε = 0.1, δ = 0.05, σ² = 9の場合:
$$n \geq \frac{9}{0.01 \times 0.05} = \frac{9}{0.0005} = 18000$$