青の統計学-DS Playground-

確率とは何か:事象・標本空間・基本法則

Stage 2 — 第1章| 統計学基礎カリキュラム 推定学習時間:40〜50分 | 難易度:★★☆☆☆


この章で学ぶこと

「明日雨が降る確率は60%」「このくじが当たる確率は1%」——確率は日常語として使われますが、統計学では厳密な定義と計算ルールがあります。

この章で確率の基本ルールを押さえておくと、後の確率分布・推定・検定がスムーズに理解できます。

この章を終えると、こんなことができるようになります:

  • 試行・事象・標本空間を正確に定義できる
  • 古典的確率と統計的確率の違いを説明できる
  • 加法定理・余事象・確率の公理を使って確率を計算できる
  • 「排反事象」と「非排反事象」を区別して加法定理を使い分けられる

1. なぜ確率が必要か

Stage 1 では、手元にあるデータをまとめる記述統計を学びました。 しかし統計学の本当の力は「まだ観測していないことを予測する」ことにあります。

  • 来月の売上はいくらか?
  • この薬は本当に効くか?
  • コインを10回投げて8回表が出たら、このコインは不正か?

これらの問いに答えるために、不確実性を数値で扱う道具が確率です。


2. 基本用語を揃える

確率の話をするには、まず「何の確率か」を明確にする言語が必要です。

2.1 試行(Trial)

結果が不確実な操作や実験のことを試行と呼びます。

  • コインを1回投げる
  • サイコロを1回振る
  • 製品を1個ランダムに抜き取って検査する

2.2 標本空間(Sample Space)

試行で起こりうるすべての結果の集合標本空間 $\Omega$(オメガ)と呼びます。

試行 標本空間 $\Omega$
コインを1回投げる $\{表, 裏\}$
サイコロを1回振る $\{1, 2, 3, 4, 5, 6\}$
2枚のコインを投げる $\{(表,表), (表,裏), (裏,表), (裏,裏)\}$

2.3 根元事象(Elementary Event)

標本空間の各要素1つ1つが根元事象です。サイコロ1回の試行なら「1が出る」「2が出る」…「6が出る」の6つが根元事象です。

2.4 事象(Event)

標本空間の部分集合事象 と呼びます。根元事象の集まりです。

例) サイコロで「偶数が出る」という事象 $A$:

$A = \{2, 4, 6\}$

事象は集合として扱えるので、集合演算がそのまま使えます:

記号 意味 例($A = \{2,4,6\}$、$B = \{1,2,3\}$)
$A \cup B$ $A$または$B$(和事象) $\{1,2,3,4,6\}$
$A \cap B$ $A$かつ$B$(積事象) $\{2\}$
$A^c$ $A$ でない(余事象) $\{1,3,5\}$

[図1] 事象のベン図 事象のベン図


📘 専門的な補足:ド・モルガンの法則

集合の余事象には次の重要な法則があります:

$(A \cup B)^c = A^c \cap B^c$ $(A \cap B)^c = A^c \cup B^c$

言葉で言うと:

  • 「AまたはBでない」=「Aでない、かつBでない」
  • 「AかつBでない」=「Aでない、またはBでない」

これは確率の計算、特に「少なくとも1回成功する確率」を求めるときに威力を発揮します(余事象の利用)。


3. 確率の定義

関連教材(青の統計学)

「事象 $A$ の確率」を $P(A)$ と書きます。確率にはいくつかの定義・解釈があります。

3.1 古典的確率(Classical Probability)

すべての根元事象が同様に確からしい(equally likely)とき:

$P(A) = \frac{\text{事象 } A \text{ が起こる場合の数}}{\text{全体の場合の数}} = \frac{|A|}{|\Omega|}$

例) サイコロで偶数が出る確率:

$P(\text{偶数}) = \frac{|\{2,4,6\}|}{|\{1,2,3,4,5,6\}|} = \frac{3}{6} = \frac{1}{2}$

「同様に確からしい」が前提なので、コインが歪んでいたり、サイコロが不正細工されている場合には使えません。

3.2 統計的確率(Frequentist Probability)

試行を $n$ 回繰り返したとき、事象 $A$ が $n_A$ 回起こったとする。$n$ を大きくしていくと相対度数が安定してくる値:

$P(A) = \lim_{n \to \infty} \frac{n_A}{n}$

例) コインを10,000回投げて5,012回表が出た → 表の確率 ≈ 0.5012

大数の法則(後の章で学びます)により、試行回数を増やすほど相対度数は真の確率に近づきます。


📘 専門的な補足:確率の公理(コルモゴロフの公理)

確率の厳密な数学的基礎は、1933年にコルモゴロフが定めた3つの公理から成り立ちます:

  1. 非負性:任意の事象 $A$ に対して $P(A) \geq 0$
  2. 規格化:標本空間全体の確率は1:$P(\Omega) = 1$
  3. 加法性:排反な事象 $A_1, A_2, \ldots$($A_i \cap A_j = \emptyset$)に対して:

$P(A_1 \cup A_2 \cup \cdots) = P(A_1) + P(A_2) + \cdots$

この3つの公理だけから、後述する加法定理・余事象の公式などすべての確率の性質を論理的に導けます。公理の暗記よりも「確率が満たすべきルールの出所」として理解しておくと、計算のたびに腑に落ちるようになります。


4. 確率の基本法則

関連教材(青の統計学)

4.1 確率の範囲

任意の事象 $A$ に対して:

$0 \leq P(A) \leq 1$

  • $P(A) = 0$:絶対に起こらない(不可能事象)
  • $P(A) = 1$:必ず起こる(全事象 $\Omega$)

4.2 余事象の法則

事象 $A$ が起こらない確率(余事象 $A^c$ の確率):

$P(A^c) = 1 - P(A)$

例) サイコロで「1が出る確率」= 1/6 → 「1以外が出る確率」= 1 − 1/6 = 5/6

「少なくとも〜」という問題は、余事象を使うと楽に解けます:

$P(\text{少なくとも1回表}) = 1 - P(\text{全て裏})$

4.3 加法定理(確率の加法則)

【排反事象の場合】($A \cap B = \emptyset$、同時に起こらない)

$P(A \cup B) = P(A) + P(B)$

【非排反事象の場合】($A \cap B \neq \emptyset$、同時に起こりうる)

$P(A \cup B) = P(A) + P(B) - P(A \cap B)$

$P(A \cap B)$ を引くのは、$A$ と $B$ の両方に含まれる部分を2回足してしまうのを修正するためです。


[図2] 加法定理のベン図(非排反の場合) 加法定理のベン図


例) トランプ1枚を引くとき、「ハートまたは絵札(J・Q・K)が出る確率」

  • $P(\text{ハート}) = 13/52$(ハートは13枚)
  • $P(\text{絵札}) = 12/52$(絵札は4スート×3枚)
  • $P(\text{ハートかつ絵札}) = 3/52$(ハートのJ・Q・K)

$P(\text{ハートまたは絵札}) = \frac{13}{52} + \frac{12}{52} - \frac{3}{52} = \frac{22}{52} = \frac{11}{26}$


確率の性質まとめ:

性質
非負性 $P(A) \geq 0$
全事象 $P(\Omega) = 1$
不可能事象 $P(\emptyset) = 0$
余事象 $P(A^c) = 1 - P(A)$
加法定理(排反) $P(A \cup B) = P(A) + P(B)$
加法定理(一般) $P(A \cup B) = P(A) + P(B) - P(A \cap B)$

5. 演習問題

問題1(古典的確率)

袋の中に赤玉4個、白玉3個、青玉2個、合計9個が入っています。1個を無作為に取り出すとき、以下の確率を求めてください。

(1)赤玉を取り出す確率 (2)白玉または青玉を取り出す確率 (3)赤玉でない玉を取り出す確率

💡 解答・解説を見る

標本空間の大きさ:$|\Omega| = 9$

(1)赤玉を取り出す確率:

$P(\text{赤}) = \frac{4}{9}$

(2)白玉または青玉を取り出す確率:

「白玉を取り出す」事象と「青玉を取り出す」事象は排反(同時には起きない)なので:

$P(\text{白} \cup \text{青}) = P(\text{白}) + P(\text{青}) = \frac{3}{9} + \frac{2}{9} = \frac{5}{9}$

別解(余事象):白または青 = 赤でない

$P(\text{赤でない}) = 1 - P(\text{赤}) = 1 - \frac{4}{9} = \frac{5}{9}$

(3)赤玉でない玉を取り出す確率:

$P(\text{赤}^c) = 1 - P(\text{赤}) = 1 - \frac{4}{9} = \frac{5}{9}$

(2)と(3)は同じ問いです。両方のアプローチで同じ答えになることを確認しましょう。


問題2(余事象の利用)

コインを3回投げます。「少なくとも1回表が出る」確率を求めてください。

(ヒント:余事象を使うと計算が楽です)

💡 解答・解説を見る

余事象を使うアプローチ:

「少なくとも1回表が出る」の余事象は「1回も表が出ない(3回全て裏)」です。

3回のコイン投げの標本空間は $2^3 = 8$ 通り(すべて同様に確からしい):

$\Omega = \{(表表表), (表表裏), (表裏表), (表裏裏), (裏表表), (裏表裏), (裏裏表), (裏裏裏)\}$

$P(\text{3回全て裏}) = \frac{1}{8}$

$P(\text{少なくとも1回表}) = 1 - P(\text{3回全て裏}) = 1 - \frac{1}{8} = \frac{7}{8}$

直接数える場合(確認): 「少なくとも1回表」=全事象8通りから「全て裏」の1通りを除いた7通り $P = \frac{7}{8}$ ✓

なぜ余事象が有利か: 「少なくとも1回〜」という事象を直接数えようとすると、「ちょうど1回表」「ちょうど2回表」「ちょうど3回表」の3パターンを別々に計算して足す必要があります。余事象を使えば1回の計算で済みます。この考え方はコイン・サイコロ・製品検査など多くの問題に使えます。


問題3(加法定理)

1〜20の整数が1枚ずつ書かれた20枚のカードから1枚引くとき、「3の倍数または5の倍数が書かれたカードを引く」確率を求めてください。

💡 解答・解説を見る

各事象を整理します:

  • 事象 $A$「3の倍数」:$\{3, 6, 9, 12, 15, 18\}$ → 6枚
  • 事象 $B$「5の倍数」:$\{5, 10, 15, 20\}$ → 4枚
  • 事象 $A \cap B$「3かつ5の倍数」=「15の倍数」:$\{15\}$ → 1枚

$A$ と $B$ は排反ではない(15という共通要素がある)ので、一般の加法定理を使います:

$P(A \cup B) = P(A) + P(B) - P(A \cap B)$

$= \frac{6}{20} + \frac{4}{20} - \frac{1}{20} = \frac{9}{20}$

ポイント: $A \cap B$ を引かずに $6/20 + 4/20 = 10/20$ としてしまうと、15を2回カウントしてしまいます。排反かどうかを必ず確認することが重要です。


まとめ

用語 定義
標本空間$\Omega$ 起こりうる全結果の集合
事象$A$ 標本空間の部分集合
古典的確率 場合の数の比(同様に確からしい場合)
余事象 $P(A^c) = 1 - P(A)$
排反事象 $A \cap B = \emptyset$:同時に起こらない
加法定理(排反) $P(A \cup B) = P(A) + P(B)$
加法定理(一般) $P(A \cup B) = P(A) + P(B) - P(A \cap B)$

この章のキーメッセージ: 確率は「いくつかの公理から論理的に導かれる数値」です。 「感覚で当てずっぽう」でも「暗記した公式の当てはめ」でもなく、 標本空間・事象を明確にしてから、ルールに従って計算する——この手順の習慣が、複雑な問題でも迷わないための基礎になります。


次の章へ

「AとBが同時に起こる確率」「Aが起きたことがわかったときのBの確率」——これを扱うのが次章のテーマです。

次: 条件付き確率と独立性