ベイズ統計学

ベイズの定理、事前分布、事後分布、MCMC法、階層ベイズモデルなど統計検定準1級レベルのベイズ統計理論を学習します。

経験ベイズ法による推定 レベル1

3つの工場でそれぞれ10個の製品を検査し、不良品数が2個、4個、6個であった。各工場の不良率$θᵢ$をベータ分布$Beta(α,β)$で事前分布とし、経験ベイズ法で$α=2, β=8$と推定された。工場2の事後平均(経験ベイズ推定値)はいくらか。

解説
解答と解説を表示
<h4>経験ベイズ法:データからハイパーパラメータを学習する手法</h4><p>経験ベイズ法は、事前分布のハイパーパラメータを観測データから推定し、より現実的なベイズ推論を行う手法です。複数の類似した問題を同時に扱う際に特に有効です。</p><div class='key-point'><div class='key-point-title'>経験ベイズ法の基本概念</div><ul><li><strong>階層モデル</strong>:$\theta_i \sim \text{Beta}(\alpha, \beta)$, $X_i|\theta_i \sim \text{Binomial}(n_i, \theta_i)
lt;/li><li><strong>ハイパーパラメータ推定</strong>:$(\alpha, \beta)$をデータから推定</li><li><strong>経験ベイズ推定</strong>:推定されたハイパーパラメータで事後分布を計算</li></ul></div><p class='step'><strong>Step 1: 問題設定の整理</strong></p><p>各工場のデータ:</p><ul><li><strong>工場1</strong>:10個中2個不良(成功率推定:2/10 = 0.2)</li><li><strong>工場2</strong>:10個中4個不良(成功率推定:4/10 = 0.4)</li><li><strong>工場3</strong>:10個中6個不良(成功率推定:6/10 = 0.6)</li></ul><p>階層モデル:</p><div class='formula'>$\theta_i \sim \text{Beta}(\alpha, \beta) \quad (i = 1, 2, 3)$
$X_i|\theta_i \sim \text{Binomial}(n_i = 10, \theta_i)$

Step 2: 経験ベイズ推定の原理

経験ベイズ法では、ハイパーパラメータ$(\alpha, \beta)$をデータから推定します。一般的な方法:

  1. モーメント法:標本平均・分散とベータ分布の理論値を対応させる
  2. 最尤法:周辺尤度を最大化
  3. EM算法:欠測データとして潜在変数を扱う

問題では$\alpha = 2, \beta = 8$が与えられています。

Step 3: 推定されたハイパーパラメータの検証

ベータ分布$\text{Beta}(2, 8)$の性質:

$E[\theta] = \frac{\alpha}{\alpha + \beta} = \frac{2}{2 + 8} = \frac{2}{10} = 0.2$
$\text{Var}[\theta] = \frac{\alpha\beta}{(\alpha + \beta)^2(\alpha + \beta + 1)} = \frac{2 \times 8}{10^2 \times 11} = \frac{16}{1100} ≈ 0.015$

標本での検証:

$\bar{\theta} = \frac{0.2 + 0.4 + 0.6}{3} = \frac{1.2}{3} = 0.4$

理論平均0.2と標本平均0.4の差は、経験ベイズ推定の課題を示しています。

Step 4: 工場2の事後分布計算

ベータ-二項共役性により、工場2の事後分布は:

$\theta_2|x_2 \sim \text{Beta}(\alpha + x_2, \beta + n_2 - x_2)$

ここで:

  • $\alpha = 2$(推定されたハイパーパラメータ)
  • $\beta = 8$(推定されたハイパーパラメータ)
  • $x_2 = 4$(工場2の不良品数)
  • $n_2 = 10$(工場2の検査数)
$\theta_2|x_2 \sim \text{Beta}(2 + 4, 8 + 10 - 4) = \text{Beta}(6, 14)$

Step 5: 経験ベイズ推定値の計算

工場2の事後平均(経験ベイズ推定値):

$\hat{\theta}_2^{EB} = E[\theta_2|x_2] = \frac{6}{6 + 14} = \frac{6}{20} = 0.3$

より詳細な計算:

$\hat{\theta}_2^{EB} = \frac{\alpha + x_2}{\alpha + \beta + n_2} = \frac{2 + 4}{2 + 8 + 10} = \frac{6}{20} = 0.300$

小数第3位まで:0.300

経験ベイズ推定の特徴

推定法工場2の推定値特徴
最尤推定4/10 = 0.400データのみ使用
経験ベイズ6/20 = 0.300他の工場のデータも活用
収縮効果0.4 → 0.3全体平均方向への調整

Step 6: 収縮効果の分析

経験ベイズ推定は、個別推定値を全体の傾向に向けて収縮させます:

$\hat{\theta}_i^{EB} = \frac{\alpha + x_i}{\alpha + \beta + n_i}$

これは次のように分解できます:

$\hat{\theta}_i^{EB} = \lambda \cdot \frac{x_i}{n_i} + (1-\lambda) \cdot \frac{\alpha}{\alpha + \beta}$

ここで、$\lambda = \frac{n_i}{\alpha + \beta + n_i} = \frac{10}{20} = 0.5$

$\hat{\theta}_2^{EB} = 0.5 \times 0.4 + 0.5 \times 0.2 = 0.2 + 0.1 = 0.3$

Step 7: 全工場の経験ベイズ推定値

工場不良品数MLE経験ベイズ収縮効果
12/100.2000.200なし
24/100.4000.300↓ 0.1
36/100.6000.400↓ 0.2

収縮パターンの解釈

  • 極端値の修正:高い値(工場3)がより大きく収縮
  • 安定化効果:個別推定の不安定性を軽減
  • 情報借用:類似データからの学習効果

Step 8: 予測分布による検証

工場2で新たに1個検査した時の不良確率:

$P(\text{新製品が不良}|x_2) = E[\theta_2|x_2] = 0.3$</div><p>これは点推定値と一致し、予測の一貫性を示しています。</p>
問題 1/10
カテゴリ一覧に戻る