超幾何分布と品質管理の理論
超幾何分布 $X \sim Hypergeom(N, K, n)$ は、有限母集団からの復元なし抽出をモデル化した分布です。品質管理、投票予測、臨床試験など、「母集団が小さく、抽出が母集団に影響する」場合に使用されます。
超幾何分布の定義
$P(X = k) = \frac{\binom{K}{k} \binom{N-K}{n-k}}{\binom{N}{n}}$
パラメータの意味:
- $N = 20$ :母集団の大きさ(全ロット数)
- $K = 3$ :母集団内の成功アイテム数(不良品数)
- $n = 5$ :抽出数(サンプルサイズ)
- $k = 1$ :成功アイテムの抽出数(不良品の発見数)
組み合わせの意味
| 要素 | 式 | 意味 | 値 |
|---|
| 不良品からの選択 | $\binom{K}{k} = \binom{3}{1}$ | 3個の不良品から1個選ぶ | 3 |
| 良品からの選択 | $\binom{N-K}{n-k} = \binom{17}{4}$ | 17個の良品から4個選ぶ | 2380 |
| 全体からの選択 | $\binom{N}{n} = \binom{20}{5}$ | 20個から5個選ぶ総方法 | 15504 |
詳細計算
$\binom{3}{1} = 3$
$\binom{17}{4} = \frac{17!}{4! \cdot 13!} = \frac{17 \times 16 \times 15 \times 14}{4 \times 3 \times 2 \times 1} = \frac{57120}{24} = 2380$
$\binom{20}{5} = \frac{20!}{5! \cdot 15!} = \frac{20 \times 19 \times 18 \times 17 \times 16}{5 \times 4 \times 3 \times 2 \times 1} = \frac{1860480}{120} = 15504$
最終計算:
$P(X=1) = \frac{3 \times 2380}{15504} = \frac{7140}{15504} \approx 0.4606 \approx 0.46$
結果の解釈
20個の製品中3個不良品があるロットから5個抽出したとき、ちょうど1個が不良品である確率は約46%です。
二項分布との比較
- 超幾何分布:母集団有限、復元なし抽出
- 二項分布:母集団無限(または復元あり)
- 近似条件:$N$ が十分大きく $n/N < 0.1$ のとき
| 手法 | 使用条件 | 今回の値 | 適用性 |
|---|
| 超幾何分布 | 母集団有限 | 0.46 | 正確 |
| 二項分布近似 | n/N << 1 | $n/N = 5/20 = 0.25$ | 不適切 |