ベイズ統計学

ベイズの定理、事前分布、事後分布、MCMC法、階層ベイズモデルなど統計検定準1級レベルのベイズ統計理論を学習します。

ベイズネットワークの構築 レベル1

医療診断のベイズネットワークを考える。疾病D(あり/なし)、症状S₁(発熱:あり/なし)、症状S₂(咳:あり/なし)がある。事前確率P(D=あり)=0.1、P(S₁=あり|D=あり)=0.8、P(S₁=あり|D=なし)=0.2、P(S₂=あり|D=あり)=0.7、P(S₂=あり|D=なし)=0.3。患者が発熱と咳の両方を呈している場合、疾病がある確率はいくらか。小数第3位まで求めよ。

解説
解答と解説を表示

ベイズネットワークによる医療診断推論

ベイズネットワークは、確率的依存関係をグラフ構造で表現し、不確実性下での推論を効率的に行う強力な手法です。医療診断分野では特に重要な応用があります。

ベイズネットワークの基本構造

この問題のネットワーク構造:

   疾病 D\n    ↙  ↘\n 症状S₁  症状S₂\n(発熱) (咳)

仮定:疾病Dが与えられたとき、症状S₁とS₂は条件付き独立

$$P(S_1, S_2|D) = P(S_1|D) \\times P(S_2|D)$$

Step 1: 与えられた情報の整理

確率意味
$P(D=\\text{あり})$0.1疾病の事前確率
$P(D=\\text{なし})$0.9健康の事前確率
$P(S_1=\\text{あり}|D=\\text{あり})$0.8疾病時の発熱確率
$P(S_1=\\text{あり}|D=\\text{なし})$0.2健康時の発熱確率
$P(S_2=\\text{あり}|D=\\text{あり})$0.7疾病時の咳確率
$P(S_2=\\text{あり}|D=\\text{なし})$0.3健康時の咳確率

Step 2: 求める値の定式化

求める値:$P(D=\\text{あり}|S_1=\\text{あり}, S_2=\\text{あり})$

ベイズの定理を適用:

$$P(D=\\text{あり}|S_1, S_2) = \\frac{P(S_1, S_2|D=\\text{あり}) \\times P(D=\\text{あり})}{P(S_1, S_2)}$$

Step 3: 条件付き独立性の活用

疾病が与えられたとき、症状は条件付き独立:

$$P(S_1=\\text{あり}, S_2=\\text{あり}|D=\\text{あり}) = P(S_1=\\text{あり}|D=\\text{あり}) \\times P(S_2=\\text{あり}|D=\\text{あり})$$
$$= 0.8 \\times 0.7 = 0.56$$

同様に:

$$P(S_1=\\text{あり}, S_2=\\text{あり}|D=\\text{なし}) = 0.2 \\times 0.3 = 0.06$$

Step 4: 全確率の法則による分母計算

$$P(S_1=\\text{あり}, S_2=\\text{あり}) = P(S_1, S_2|D=\\text{あり}) \\times P(D=\\text{あり}) + P(S_1, S_2|D=\\text{なし}) \\times P(D=\\text{なし})$$
$$= 0.56 \\times 0.1 + 0.06 \\times 0.9$$
$$= 0.056 + 0.054 = 0.110$$

Step 5: 事後確率の計算

$$P(D=\\text{あり}|S_1=\\text{あり}, S_2=\\text{あり}) = \\frac{0.56 \\times 0.1}{0.110} = \\frac{0.056}{0.110}$$
$$= \\frac{56}{110} = \\frac{28}{55} = 0.509090...$$

小数第3位まで:0.509

計算の検証

別の方法で確認してみましょう:

尤度比アプローチ

$$\\text{尤度比} = \\frac{P(S_1, S_2|D=\\text{あり})}{P(S_1, S_2|D=\\text{なし})} = \\frac{0.56}{0.06} = \\frac{28}{3} ≈ 9.33$$

事前オッズ:$\\frac{P(D=\\text{あり})}{P(D=\\text{なし})} = \\frac{0.1}{0.9} = \\frac{1}{9}$

事後オッズ:$\\frac{1}{9} \\times \\frac{28}{3} = \\frac{28}{27}$

事後確率:$\\frac{28/27}{1 + 28/27} = \\frac{28}{27 + 28} = \\frac{28}{55} = 0.509$

Step 6: 結果の解釈

推定手法確率解釈
事前確率0.100症状を知る前の疾病確率
事後確率0.509発熱と咳の両方がある場合
確率向上約5倍症状観測による診断価値

Step 7: ベイズネットワークの推論手法

一般的な推論アルゴリズム

  • 変数消去法:変数を順次積分消去
  • 信念伝播法:メッセージパッシングによる近似推論
  • サンプリング法:モンテカルロ法による近似
  • 接合木法:効率的な厳密推論

Step 8: 医療診断での実用性

実践的応用

  • 多段階診断:複数の検査結果の統合
  • 診断支援:医師の意思決定支援
  • 費用対効果:検査の優先順位決定
  • 予後予測:治療効果の予測

Step 9: ネットワーク拡張の可能性

より複雑な医療診断ネットワークでは:

        年齢     性別\n         ↓       ↓\n    遺伝要因 → 疾病 ← 環境要因\n       ↓     ↙  ↘    ↓\n   検査結果  症状1  症状2  検査値

このような階層的構造で、より精密な診断が可能になります。

条件付き独立性の重要性

ベイズネットワークの効率性は条件付き独立性仮定に依存します:

  • 計算複雑度の削減:指数的→多項式時間
  • 必要データ量の削減:パラメータ数の大幅減少
  • 解釈可能性:因果関係の明確化
問題 1/10
カテゴリ一覧に戻る