ベイズネットワークによる医療診断推論
ベイズネットワークは、確率的依存関係をグラフ構造で表現し、不確実性下での推論を効率的に行う強力な手法です。医療診断分野では特に重要な応用があります。
ベイズネットワークの基本構造
この問題のネットワーク構造:
疾病 D
↙ ↘
症状S₁ 症状S₂
(発熱) (咳)
仮定:疾病Dが与えられたとき、症状S₁とS₂は条件付き独立
$P(S_1, S_2|D) = P(S_1|D) \times P(S_2|D)$
Step 1: 与えられた情報の整理
| 確率 | 値 | 意味 |
|---|
| $P(D=\text{あり})$ | 0.1 | 疾病の事前確率 |
| $P(D=\text{なし})$ | 0.9 | 健康の事前確率 |
| $P(S_1=\text{あり}|D=\text{あり})$ | 0.8 | 疾病時の発熱確率 |
| $P(S_1=\text{あり}|D=\text{なし})$ | 0.2 | 健康時の発熱確率 |
| $P(S_2=\text{あり}|D=\text{あり})$ | 0.7 | 疾病時の咳確率 |
| $P(S_2=\text{あり}|D=\text{なし})$ | 0.3 | 健康時の咳確率 |
Step 2: 求める値の定式化
求める値:$P(D=\text{あり}|S_1=\text{あり}, S_2=\text{あり})$
ベイズの定理を適用:
$P(D=\text{あり}|S_1, S_2) = \frac{P(S_1, S_2|D=\text{あり}) \times P(D=\text{あり})}{P(S_1, S_2)}$
Step 3: 条件付き独立性の活用
疾病が与えられたとき、症状は条件付き独立:
$P(S_1=\text{あり}, S_2=\text{あり}|D=\text{あり}) = P(S_1=\text{あり}|D=\text{あり}) \times P(S_2=\text{あり}|D=\text{あり})$
$= 0.8 \times 0.7 = 0.56$
同様に:
$P(S_1=\text{あり}, S_2=\text{あり}|D=\text{なし}) = 0.2 \times 0.3 = 0.06$
Step 4: 全確率の法則による分母計算
$P(S_1=\text{あり}, S_2=\text{あり}) = P(S_1, S_2|D=\text{あり}) \times P(D=\text{あり}) + P(S_1, S_2|D=\text{なし}) \times P(D=\text{なし})$
$= 0.56 \times 0.1 + 0.06 \times 0.9$
$= 0.056 + 0.054 = 0.110$
Step 5: 事後確率の計算
$P(D=\text{あり}|S_1=\text{あり}, S_2=\text{あり}) = \frac{0.56 \times 0.1}{0.110} = \frac{0.056}{0.110}$
$= \frac{56}{110} = \frac{28}{55} = 0.509090...$
小数第3位まで:0.509
計算の検証
別の方法で確認してみましょう:
尤度比アプローチ:
$\text{尤度比} = \frac{P(S_1, S_2|D=\text{あり})}{P(S_1, S_2|D=\text{なし})} = \frac{0.56}{0.06} = \frac{28}{3} ≈ 9.33$
事前オッズ:$\frac{P(D=\text{あり})}{P(D=\text{なし})} = \frac{0.1}{0.9} = \frac{1}{9}$
事後オッズ:$\frac{1}{9} \times \frac{28}{3} = \frac{28}{27}$
事後確率:$\frac{28/27}{1 + 28/27} = \frac{28}{27 + 28} = \frac{28}{55} = 0.509$
Step 6: 結果の解釈
| 推定手法 | 確率 | 解釈 |
|---|
| 事前確率 | 0.100 | 症状を知る前の疾病確率 |
| 事後確率 | 0.509 | 発熱と咳の両方がある場合 |
| 確率向上 | 約5倍 | 症状観測による診断価値 |
Step 7: ベイズネットワークの推論手法
一般的な推論アルゴリズム
- 変数消去法:変数を順次積分消去
- 信念伝播法:メッセージパッシングによる近似推論
- サンプリング法:モンテカルロ法による近似
- 接合木法:効率的な厳密推論
Step 8: 医療診断での実用性
実践的応用
- 多段階診断:複数の検査結果の統合
- 診断支援:医師の意思決定支援
- 費用対効果:検査の優先順位決定
- 予後予測:治療効果の予測
Step 9: ネットワーク拡張の可能性
より複雑な医療診断ネットワークでは:
年齢 性別
↓ ↓
遺伝要因 → 疾病 ← 環境要因
↓ ↙ ↘ ↓
検査結果 症状1 症状2 検査値
このような階層的構造で、より精密な診断が可能になります。
条件付き独立性の重要性
ベイズネットワークの効率性は条件付き独立性仮定に依存します:
- 計算複雑度の削減:指数的→多項式時間
- 必要データ量の削減:パラメータ数の大幅減少
- 解釈可能性:因果関係の明確化