二項分布の期待値と分散の理論的背景
二項分布 $X \sim Bin(n,p)$ は、$n$ 回の独立ベルヌーイ試行における成功回数をモデル化した、基本の離散確率分布です。品質管理、臨床試験、A/Bテストなど幅広い分野で活用されています。
数学的定義
$X = I_1 + I_2 + \cdots + I_n$ ($I_i$ は $i$ 回目の成功指示変数)
$I_i = \begin{cases} 1 & 成功確率 p \\ 0 & 失敗確率 1-p \end{cases}$
期待値の導出
線形性により:
$E[X] = E[I_1 + I_2 + \cdots + I_n] = E[I_1] + E[I_2] + \cdots + E[I_n]$
各 $I_i$ は同じベルヌーイ分布 $Ber(p)$ に従うため:
$E[I_i] = 1 \cdot p + 0 \cdot (1-p) = p$
したがって:
$E[X] = np$
分散の導出
独立性を使って:
$Var(X) = Var(I_1) + Var(I_2) + \cdots + Var(I_n)$
ベルヌーイ分布の分散:
$Var(I_i) = E[I_i^2] - (E[I_i])^2 = p - p^2 = p(1-p)$
したがって:
$Var(X) = n \cdot p(1-p)$
分散の直感的理解
| pの値 | p(1-p) | 意味 |
|---|
| 0.1 | 0.09 | 成功稀→ばらつき小 |
| 0.5 | 0.25 | 最大のばらつき |
| 0.9 | 0.09 | 失敗稀→ばらつき小 |
正規近似:np および np(1-p) が大きいとき、$X \approx N(np, np(1-p))$ で近似可能です。