解答と解説を表示
<h4>ベイズ線形回帰における事後分布の具体的計算</h4><p>この問題では、ベイズ線形回帰の共役性を利用して、回帰係数の事後分布を解析的に計算します。</p><div class='key-point'><h4>問題設定</h4><ul><li><strong>モデル</strong>:$y = \beta_0 + \beta_1 x + \epsilon
lt;/li><li><strong>誤差</strong>:$\epsilon \sim N(0, 1)
lt;/li><li><strong>事前分布</strong>:$\beta_0, \beta_1 \sim N(0, 4)$(独立)</li><li><strong>データ</strong>:$(x_1, y_1) = (1, 3)$, $(x_2, y_2) = (2, 5)
lt;/li></ul></div><p class='step'><strong>Step 1: 行列表現の設定</strong></p><p>設計行列$\mathbf{X}$と応答ベクトル$\mathbf{y}$:</p><div class='formula'>$\mathbf{X} = \begin{pmatrix} 1 & 1 \\ 1 & 2 \end{pmatrix}, \quad \mathbf{y} = \begin{pmatrix} 3 \\ 5 \end{pmatrix}$
パラメータベクトル:
$\boldsymbol{\beta} = \begin{pmatrix} \beta_0 \\ \beta_1 \end{pmatrix}$
Step 2: 事前分布の設定
事前平均と事前共分散行列:
$\boldsymbol{\mu}_0 = \begin{pmatrix} 0 \\ 0 \end{pmatrix}, \quad \mathbf{\Sigma}_0 = \begin{pmatrix} 4 & 0 \\ 0 & 4 \end{pmatrix}$
事前精度行列:
$\mathbf{\Sigma}_0^{-1} = \begin{pmatrix} 1/4 & 0 \\ 0 & 1/4 \end{pmatrix}$
Step 3: 必要な行列計算
$\mathbf{X}^T\mathbf{X} = \begin{pmatrix} 1 & 1 \\ 1 & 2 \end{pmatrix}^T \begin{pmatrix} 1 & 1 \\ 1 & 2 \end{pmatrix} = \begin{pmatrix} 2 & 3 \\ 3 & 5 \end{pmatrix}$
$\mathbf{X}^T\mathbf{y} = \begin{pmatrix} 1 & 1 \\ 1 & 2 \end{pmatrix}^T \begin{pmatrix} 3 \\ 5 \end{pmatrix} = \begin{pmatrix} 8 \\ 13 \end{pmatrix}$
Step 4: 事後精度行列の計算
$\sigma^2 = 1$なので:
$\mathbf{\Sigma}_n^{-1} = \mathbf{\Sigma}_0^{-1} + \mathbf{X}^T\mathbf{X} = \begin{pmatrix} 1/4 & 0 \\ 0 & 1/4 \end{pmatrix} + \begin{pmatrix} 2 & 3 \\ 3 & 5 \end{pmatrix}$
$= \begin{pmatrix} 2.25 & 3 \\ 3 & 5.25 \end{pmatrix}$
Step 5: 事後共分散行列の計算
2×2行列の逆行列公式を使用:
$\mathbf{\Sigma}_n = \mathbf{\Sigma}_n^{-1} = \frac{1}{\det(\mathbf{\Sigma}_n^{-1})} \begin{pmatrix} 5.25 & -3 \\ -3 & 2.25 \end{pmatrix}$
行列式:
$\det(\mathbf{\Sigma}_n^{-1}) = 2.25 \times 5.25 - 3^2 = 11.8125 - 9 = 2.8125$
$\mathbf{\Sigma}_n = \frac{1}{2.8125} \begin{pmatrix} 5.25 & -3 \\ -3 & 2.25 \end{pmatrix} = \begin{pmatrix} 1.867 & -1.067 \\ -1.067 & 0.800 \end{pmatrix}$
Step 6: 事後平均の計算
$\boldsymbol{\mu}_n = \mathbf{\Sigma}_n \left( \mathbf{\Sigma}_0^{-1}\boldsymbol{\mu}_0 + \mathbf{X}^T\mathbf{y} \right)$
事前情報項はゼロなので:
$\boldsymbol{\mu}_n = \mathbf{\Sigma}_n \mathbf{X}^T\mathbf{y} = \begin{pmatrix} 1.867 & -1.067 \\ -1.067 & 0.800 \end{pmatrix} \begin{pmatrix} 8 \\ 13 \end{pmatrix}$
$= \begin{pmatrix} 1.867 \times 8 - 1.067 \times 13 \\ -1.067 \times 8 + 0.800 \times 13 \end{pmatrix}$
$= \begin{pmatrix} 14.936 - 13.871 \\ -8.536 + 10.400 \end{pmatrix} = \begin{pmatrix} 1.065 \\ 1.864 \end{pmatrix}$
結果の解釈
- $\beta_0$の事後平均:約1.065
- $\beta_1$の事後平均:約1.864 ≈ 1.8
- データの影響:事前分布(平均0)からのアップデート
Step 7: 結果の検証
最小二乗推定値との比較:
$\hat{\boldsymbol{\beta}}_{OLS} = (\mathbf{X}^T\mathbf{X})^{-1}\mathbf{X}^T\mathbf{y}$
$(\mathbf{X}^T\mathbf{X})^{-1} = \frac{1}{1} \begin{pmatrix} 5 & -3 \\ -3 & 2 \end{pmatrix} = \begin{pmatrix} 5 & -3 \\ -3 & 2 \end{pmatrix}$
$\hat{\boldsymbol{\beta}}_{OLS} = \begin{pmatrix} 5 & -3 \\ -3 & 2 \end{pmatrix} \begin{pmatrix} 8 \\ 13 \end{pmatrix} = \begin{pmatrix} 1 \\ 2 \end{pmatrix}$</div><p>ベイズ推定値(1.065, 1.864)は最小二乗推定値(1, 2)に近いですが、事前分布の影響で0方向に収縮しています。</p><div class='key-point'><h4>ベイズ推定の特徴</h4><ul><li><strong>収縮効果</strong>:事前分布による正則化</li><li><strong>不確実性定量化</strong>:事後分散も同時に得られる</li><li><strong>事前情報の統合</strong>:専門知識の活用</li></ul></div>