条件付き確率の考え方
条件付き確率 P(A|B) は、「Bが起きた」という条件のもとでAが起きる確率を表します。縦棒 | は「given」、つまり「〜が与えられたとき」と読みます。機械学習では、ベイズ推論、ナイーブベイズ分類、診断精度、推薦、リスク推定などで重要な役割を持ちます。G検定では、P(A|B) と P(B|A) を取り違えないことが特に重要です。
正解の理由
選択肢1のBが起きたという条件のもとでAが起きる確率が正解です。たとえば P(病気|検査陽性) は「検査が陽性だった人が病気である確率」です。一方、P(検査陽性|病気) は「病気の人が検査で陽性になる確率」であり、意味が異なります。
G検定で押さえるポイント
- P(A|B) は「Bという情報を知った後のAの確率」と考えると理解しやすいです。
- ベイズの定理では P(A|B) と P(B|A)、事前確率、周辺確率を結び付けます。
- 医療検査や不正検知では、条件付き確率の向きを間違えると大きな判断ミスにつながります。
混同しやすい論点
- P(A|B) はAとBがどちらも起きない確率ではありません。
- P(A|B) と P(B|A) は一般に等しくありません。条件の向きに注意します。
- P(A)+P(B) のような単純な足し算では、条件付き確率は求められません。
他の選択肢の評価
- 選択肢1が正解です。Bを条件としてAが起きる確率です。
- 選択肢2は条件付き確率ではありません。
- 選択肢3はP(Bでない|A)のような別の条件付き確率に近い説明です。
- 選択肢4は誤りです。条件付き確率は単純な加算では表せません。
実務上の意味
実務では、モデルの評価指標にも条件付き確率の考え方が含まれます。Precisionは「陽性と予測した中で本当に陽性の割合」、Recallは「本当の陽性の中で陽性と予測できた割合」です。どちらを重視するかは、見逃しと誤検知のコストによって変わります。
G検定では、用語の丸暗記だけでなく「どの場面で使う概念か」「何と対比されるか」まで問われやすいです。正答を選んだ後に、誤答がなぜ成り立たないかを説明できる状態にしておくと、文章表現を変えた問題にも対応しやすくなります。G検定対策では、正解語だけでなく、反対概念、代表例、限界、現在の実務での使われ方を一緒に説明できる粒度まで確認しておくと安定します。また、問題文の時代背景や技術名を手がかりに、どのAIブーム・どの学習方式・どの限界の話かを切り分けてください。