クロス集計表から条件付き確率を求める問題です。
1. 条件付き確率の定義
条件付き確率 $P(A|B)$ は、事象 $B$ が起こったという条件のもとで、事象 $A$ が起こる確率を表します。条件付き確率の定義式は以下の通りです:
$P(A|B) = \frac{P(A \cap B)}{P(B)}$
ここで、$P(A \cap B)$ は事象 $A$ と事象 $B$ が同時に起こる確率、$P(B)$ は事象 $B$ が起こる確率です。
2. 問題の整理
この問題では、以下の事象を考えます:
- 事象 $M$:調査対象者が男性である
- 事象 $B$:調査対象者が青色を好む
求めるのは、男性が青色を好む確率 $P(B|M)$ です。
3. 条件付き確率の計算
条件付き確率の定義式に従って計算します:
$P(B|M) = \frac{P(B \cap M)}{P(M)}$
クロス集計表から、以下の情報が得られます:
- $P(B \cap M) = \frac{40}{200} = 0.2$(全体200人中、男性で青色を好む人は40人)
- $P(M) = \frac{100}{200} = 0.5$(全体200人中、男性は100人)
これらの値を条件付き確率の式に代入します:
\begin{align}
P(B|M) &= \frac{P(B \cap M)}{P(M)} \\
&= \frac{0.2}{0.5} \\
&= 0.4
\end{align}
別の計算方法として、男性100人中、青色を好む人は40人なので、直接 $P(B|M) = \frac{40}{100} = 0.4$ と求めることもできます。
4. 結果の解釈
男性が青色を好む確率は0.4、つまり40%です。これは、男性の中で青色を好む人の割合が40%であることを意味します。
クロス集計表と条件付き確率の関係:
クロス集計表(分割表、コンティンジェンシー表とも呼ばれる)は、2つの変数の関係を表形式で示したものです。行と列の交差するセルの値は、両方の条件を満たすデータの度数(または割合)を表します。
クロス集計表から様々な確率を計算することができます:
- 同時確率 $P(A \cap B)$:全体に対する特定のセルの割合
- 周辺確率 $P(A)$, $P(B)$:行または列の合計の全体に対する割合
- 条件付き確率 $P(A|B)$, $P(B|A)$:特定の行または列内でのセルの割合
また、クロス集計表を用いて、2つの変数の間の関連性(独立性)を検定するためにカイ二乗検定が用いられることがあります。
したがって、男性が青色を好む確率は0.4です。