ベイズ予測分布:パラメータ不確実性を考慮した予測
ベイズ予測分布は、パラメータの不確実性を考慮して将来の観測を予測する手法で、点推定では得られない予測の幅と信頼性を提供します。
予測分布の基本概念
予測分布は、パラメータを積分消去することで得られます:
$$p(y_{\\text{new}}|\\text{data}) = \\int p(y_{\\text{new}}|\\theta) p(\\theta|\\text{data}) d\\theta$$
これにより、パラメータ推定の不確実性が予測に反映されます。
Step 1: 問題設定の整理
- 事前分布:$\\theta \\sim \\text{Beta}(2, 3)$
- 観測データ:10回中7回表(成功)
- 予測対象:次の5回投げでの表の回数Y
- 求める値:$P(Y = 3|\\text{data})$
Step 2: 事後分布の導出
ベータ-二項共役性により:
$$\\theta|\\text{data} \\sim \\text{Beta}(\\alpha + s, \\beta + f)$$
ここで:
- $\\alpha = 2$(事前パラメータ)
- $\\beta = 3$(事前パラメータ)
- $s = 7$(成功回数)
- $f = 3$(失敗回数、$10 - 7 = 3$)
$$\\theta|\\text{data} \\sim \\text{Beta}(2 + 7, 3 + 3) = \\text{Beta}(9, 6)$$
Step 3: ベータ-二項予測分布の理論
次のn回投げでk回成功する確率は、ベータ-二項分布で表されます:
$$P(Y = k|\\text{data}) = \\binom{n}{k} \\frac{B(k + \\alpha', n - k + \\beta')}{B(\\alpha', \\beta')}$$
ここで:
- $n = 5$(予測する試行回数)
- $\\alpha' = 9$(事後パラメータ)
- $\\beta' = 6$(事後パラメータ)
- $B(a,b) = \\frac{\\Gamma(a)\\Gamma(b)}{\\Gamma(a+b)}$(ベータ関数)
Step 4: ベータ関数の計算
必要なベータ関数値:
$$B(9, 6) = \\frac{\\Gamma(9)\\Gamma(6)}{\\Gamma(15)} = \\frac{8! \\times 5!}{14!}$$
$$= \\frac{40320 \\times 120}{87178291200} = \\frac{4838400}{87178291200} = \\frac{1}{18018}$$
$k = 3$の場合:
$$B(3 + 9, 5 - 3 + 6) = B(12, 8) = \\frac{\\Gamma(12)\\Gamma(8)}{\\Gamma(20)}$$
$$= \\frac{11! \\times 7!}{19!} = \\frac{39916800 \\times 5040}{121645100408832000}$$
Step 5: 二項係数の計算
$$\\binom{5}{3} = \\frac{5!}{3! \\times 2!} = \\frac{120}{6 \\times 2} = 10$$
Step 6: 確率の計算
より実用的な計算方法を使用します:
$$P(Y = 3|\\text{data}) = \\binom{5}{3} \\frac{B(12, 8)}{B(9, 6)}$$
ベータ関数の比:
$$\\frac{B(12, 8)}{B(9, 6)} = \\frac{\\Gamma(12)\\Gamma(8)\\Gamma(15)}{\\Gamma(20)\\Gamma(9)\\Gamma(6)}$$
$$= \\frac{11! \\times 7! \\times 14!}{19! \\times 8! \\times 5!}$$
段階的に計算:
$$\\frac{11!}{8!} = 11 \\times 10 \\times 9 = 990$$
$$\\frac{7!}{5!} = 7 \\times 6 = 42$$
$$\\frac{14!}{19!} = \\frac{1}{19 \\times 18 \\times 17 \\times 16 \\times 15}$$
Step 7: 数値計算による確率
実際の計算では、ベータ-二項分布の公式を使用:
$$P(Y = k) = \\binom{n}{k} \\frac{\\prod_{i=0}^{k-1}(\\alpha' + i) \\prod_{j=0}^{n-k-1}(\\beta' + j)}{\\prod_{l=0}^{n-1}(\\alpha' + \\beta' + l)}$$
$k = 3, n = 5, \\alpha' = 9, \\beta' = 6$の場合:
$$P(Y = 3) = \\binom{5}{3} \\times \\frac{9 \\times 10 \\times 11 \\times 6 \\times 7}{15 \\times 16 \\times 17 \\times 18 \\times 19}$$
$$= 10 \\times \\frac{41580}{1395360} = 10 \\times 0.02979 = 0.2979$$