ベイズネットワークの構築 - ベイズ統計学問題18

ベイズネットワークの構築レベル1

医療診断のベイズネットワークを考える。疾病D（あり/なし）、症状S₁（発熱：あり/なし）、症状S₂（咳：あり/なし）がある。事前確率P(D=あり)=0.1、P(S₁=あり|D=あり)=0.8、P(S₁=あり|D=なし)=0.2、P(S₂=あり|D=あり)=0.7、P(S₂=あり|D=なし)=0.3。患者が発熱と咳の両方を呈している場合、疾病がある確率はいくらか。小数第3位まで求めよ。

解説

解答と解説を表示

ベイズネットワークによる医療診断推論

ベイズネットワークは、確率的依存関係をグラフ構造で表現し、不確実性下での推論を効率的に行う強力な手法です。医療診断分野では特に重要な応用があります。

ベイズネットワークの基本構造

この問題のネットワーク構造：

   疾病 D\n    ↙  ↘\n 症状S₁  症状S₂\n（発熱） （咳）

仮定：疾病Dが与えられたとき、症状S₁とS₂は条件付き独立

$$P(S_1, S_2|D) = P(S_1|D) \\times P(S_2|D)$$

Step 1: 与えられた情報の整理

確率	値	意味
$P(D=\\text{あり})$	0.1	疾病の事前確率
$P(D=\\text{なし})$	0.9	健康の事前確率
$P(S_1=\\text{あり}\|D=\\text{あり})$	0.8	疾病時の発熱確率
$P(S_1=\\text{あり}\|D=\\text{なし})$	0.2	健康時の発熱確率
$P(S_2=\\text{あり}\|D=\\text{あり})$	0.7	疾病時の咳確率
$P(S_2=\\text{あり}\|D=\\text{なし})$	0.3	健康時の咳確率

Step 2: 求める値の定式化

求める値：$P(D=\\text{あり}|S_1=\\text{あり}, S_2=\\text{あり})$

ベイズの定理を適用：

$$P(D=\\text{あり}|S_1, S_2) = \\frac{P(S_1, S_2|D=\\text{あり}) \\times P(D=\\text{あり})}{P(S_1, S_2)}$$

Step 3: 条件付き独立性の活用

疾病が与えられたとき、症状は条件付き独立：

$$P(S_1=\\text{あり}, S_2=\\text{あり}|D=\\text{あり}) = P(S_1=\\text{あり}|D=\\text{あり}) \\times P(S_2=\\text{あり}|D=\\text{あり})$$

$$= 0.8 \\times 0.7 = 0.56$$

同様に：

$$P(S_1=\\text{あり}, S_2=\\text{あり}|D=\\text{なし}) = 0.2 \\times 0.3 = 0.06$$

Step 4: 全確率の法則による分母計算

$$P(S_1=\\text{あり}, S_2=\\text{あり}) = P(S_1, S_2|D=\\text{あり}) \\times P(D=\\text{あり}) + P(S_1, S_2|D=\\text{なし}) \\times P(D=\\text{なし})$$

$$= 0.56 \\times 0.1 + 0.06 \\times 0.9$$

$$= 0.056 + 0.054 = 0.110$$

Step 5: 事後確率の計算

$$P(D=\\text{あり}|S_1=\\text{あり}, S_2=\\text{あり}) = \\frac{0.56 \\times 0.1}{0.110} = \\frac{0.056}{0.110}$$

$$= \\frac{56}{110} = \\frac{28}{55} = 0.509090...$$

小数第3位まで：0.509

計算の検証

別の方法で確認してみましょう：

尤度比アプローチ：

$$\\text{尤度比} = \\frac{P(S_1, S_2|D=\\text{あり})}{P(S_1, S_2|D=\\text{なし})} = \\frac{0.56}{0.06} = \\frac{28}{3} ≈ 9.33$$

事前オッズ：$\\frac{P(D=\\text{あり})}{P(D=\\text{なし})} = \\frac{0.1}{0.9} = \\frac{1}{9}$

事後オッズ：$\\frac{1}{9} \\times \\frac{28}{3} = \\frac{28}{27}$

事後確率：$\\frac{28/27}{1 + 28/27} = \\frac{28}{27 + 28} = \\frac{28}{55} = 0.509$

Step 6: 結果の解釈

推定手法	確率	解釈
事前確率	0.100	症状を知る前の疾病確率
事後確率	0.509	発熱と咳の両方がある場合
確率向上	約5倍	症状観測による診断価値

Step 7: ベイズネットワークの推論手法

一般的な推論アルゴリズム

変数消去法：変数を順次積分消去
信念伝播法：メッセージパッシングによる近似推論
サンプリング法：モンテカルロ法による近似
接合木法：効率的な厳密推論

Step 8: 医療診断での実用性

実践的応用

多段階診断：複数の検査結果の統合
診断支援：医師の意思決定支援
費用対効果：検査の優先順位決定
予後予測：治療効果の予測

Step 9: ネットワーク拡張の可能性

より複雑な医療診断ネットワークでは：

        年齢     性別\n         ↓       ↓\n    遺伝要因 → 疾病 ← 環境要因\n       ↓     ↙  ↘    ↓\n   検査結果  症状1  症状2  検査値

このような階層的構造で、より精密な診断が可能になります。

条件付き独立性の重要性

ベイズネットワークの効率性は条件付き独立性仮定に依存します：

計算複雑度の削減：指数的→多項式時間
必要データ量の削減：パラメータ数の大幅減少
解釈可能性：因果関係の明確化