第4章：主要な検定手法

Stage 4：標本から母集団へ

この章で学ぶこと

前章で仮説検定の論理的な枠組みを学びました。この章では、実際に使われる具体的な検定手法を扱います。

z検定：母分散が既知のときの母平均検定
t検定：母分散が未知のときの母平均検定（一標本・二標本）
カイ二乗検定：カテゴリカルデータの検定

それぞれの手法がどのような状況で使われるかを理解し、手順を追って計算できるようになることを目標とします。

1. z検定（母分散が既知の場合）

関連教材（青の統計学）

統計的推定（動画）

標準誤差（動画）

母平均の区間推定と検定 - 正規分布と標準誤差の概念（記事）

概要

母集団の分散 $\sigma^2$ が既知のとき、母平均 $\mu$ に関する仮説を検定します。母集団が正規分布に従うか、標本サイズが十分に大きい（$n \geq 30$ が目安）場合に使えます。

検定統計量

$z = \frac{\bar{x} - \mu_0}{\sigma / \sqrt{n}}$

$\bar{x}$：標本平均
$\mu_0$：帰無仮説で設定した母平均
$\sigma$：母標準偏差（既知）
$n$：標本サイズ

この $z$ 値は、帰無仮説のもとで標準正規分布 $N(0,1)$ に従います。

棄却域（両側検定、$\alpha = 0.05$）

$|z| > 1.96$

両側検定の棄却域

例題

ある工場の製品の重量は、過去のデータから母標準偏差 $\sigma = 10$g とわかっている。今日の生産ラインから $n = 25$ 個を抽出したところ、標本平均 $\bar{x} = 505$g だった。「母平均は500gである」という帰無仮説を $\alpha = 0.05$ で検定せよ。

Step 1 仮説設定

$H_0: \mu = 500, \quad H_1: \mu \neq 500 \quad \text{（両側検定）}$

Step 2 有意水準：$\alpha = 0.05$

Step 3 検定統計量

$z = \frac{505 - 500}{10 / \sqrt{25}} = \frac{5}{2} = 2.50$

Step 4 判断

$|z| = 2.50 > 1.96$ なので、帰無仮説を棄却します。

Step 5 結論：有意水準5%で、母平均が500gでないと結論できます。

2. 一標本 t 検定（母分散が未知の場合）

概要

現実には、母分散 $\sigma^2$ が既知であることはほとんどありません。そのため、$\sigma$ を標本標準偏差 $s$ で推定した場合は、z分布ではなくt分布を使います。

検定統計量

$t = \frac{\bar{x} - \mu_0}{s / \sqrt{n}}$

この統計量は、帰無仮説のもとで自由度 $\nu = n - 1$ の t分布に従います。

t分布と自由度

t分布は標準正規分布より裾が重い分布です。自由度が大きくなるほど標準正規分布に近づきます。

自由度	両側5%の棄却限界値
5	2.571
10	2.228
20	2.086
30	2.042
∞（標準正規）	1.960

自由度によるt分布の変化

例題

あるコーヒーショップは「1杯あたりのカフェイン量は200mgである」と主張している。10杯を抽出して測定した結果、$\bar{x} = 212$mg、$s = 15$mg だった。$\alpha = 0.05$ で検定せよ。

Step 1 仮説設定

$H_0: \mu = 200, \quad H_1: \mu \neq 200$

Step 2 $\alpha = 0.05$、自由度 $\nu = 10 - 1 = 9$

Step 3 検定統計量

$t = \frac{212 - 200}{15 / \sqrt{10}} = \frac{12}{4.743} \approx 2.530$

Step 4 判断

自由度9の t 分布における両側5%の臨界値は $t_{0.025}(9) = 2.262$。

$|t| = 2.530 > 2.262$ なので、帰無仮説を棄却します。

Step 5 結論：有意水準5%で、母平均が200mgでないと結論できます。

3. 二標本 t 検定（二群の平均差の検定）

2つの独立したグループの平均を比較したいときに使います。

3-1. 独立標本 t 検定

等分散を仮定する場合（pooled t検定）

$t = \frac{\bar{x}_1 - \bar{x}_2}{s_p \sqrt{1/n_1 + 1/n_2}}, \quad s_p^2 = \frac{(n_1-1)s_1^2 + (n_2-1)s_2^2}{n_1+n_2-2}$

自由度：$\nu = n_1 + n_2 - 2$

等分散を仮定しない場合（Welch の t 検定）

$t = \frac{\bar{x}_1 - \bar{x}_2}{\sqrt{s_1^2/n_1 + s_2^2/n_2}}$

自由度は Welch-Satterthwaite の式で近似します（複雑なため統計ソフトに任せることが多い）。

実用的な指針：等分散かどうか不明なときは Welch の t 検定を使うのが安全です。等分散が成り立つ場合でも Welch 検定はほぼ同じ結果を与えます。

3-2. 対応のある t 検定（paired t検定）

同一の対象に対して2回測定した場合（例：投薬前後・左右の目）に使います。差 $d_i = x_{1i} - x_{2i}$ を計算し、一標本 t 検定を行います。

$t = \frac{\bar{d}}{s_d / \sqrt{n}}, \quad \nu = n - 1$

対応のあるデータを独立標本として扱うと、個体差が誤差として混入し、検出力が下がります。

4. カイ二乗検定（$\chi^2$ 検定）

カテゴリカルデータ（名義尺度・順序尺度）に対して使う検定です。

4-1. 適合度検定（goodness of fit test）

「観測された度数分布が、期待される分布と合っているか」を検定します。

検定統計量

$\chi^2 = \sum_{i=1}^{k} \frac{(O_i - E_i)^2}{E_i}$

$O_i$：観測度数（実際に数えた値）
$E_i$：期待度数（帰無仮説のもとで期待される値）
$k$：カテゴリ数

自由度：$\nu = k - 1$

例：サイコロを120回振ったとき、各目が20回ずつ出るか検定する。

目	1	2	3	4	5	6
観測 $O_i$	18	22	25	19	16	20
期待 $E_i$	20	20	20	20	20	20

$\chi^2 = \frac{(18-20)^2}{20} + \frac{(22-20)^2}{20} + \cdots + \frac{(20-20)^2}{20} = \frac{4+4+25+1+16+0}{20} = 2.50$

自由度5の $\chi^2$ 分布の5%臨界値は11.07。$2.50 < 11.07$ なので帰無仮説を棄却できません。

4-2. 独立性検定（test of independence）

「2つのカテゴリカル変数が独立かどうか」を検定します。クロス集計表（分割表）を使います。

例：性別と商品の好みが独立かどうかを検定する。

	商品A好き	商品B好き	計
男性	30	20	50
女性	25	25	50
計	55	45	100

期待度数（行合計 × 列合計 ÷ 総計）：

$E_{11} = \frac{50 \times 55}{100} = 27.5, \quad E_{12} = \frac{50 \times 45}{100} = 22.5$

$\chi^2 = \sum \frac{(O - E)^2}{E} = \frac{(30-27.5)^2}{27.5} + \frac{(20-22.5)^2}{22.5} + \frac{(25-27.5)^2}{27.5} + \frac{(25-22.5)^2}{22.5}$

$= 0.227 + 0.278 + 0.227 + 0.278 = 1.010$

自由度：$\nu = (\text{行数}-1) \times (\text{列数}-1) = 1 \times 1 = 1$

$\chi^2$ 分布の自由度1・5%臨界値は3.84。$1.010 < 3.84$ なので独立性を棄却できません。

カイ二乗分布と棄却域

注意：期待度数が5未満のセルが多い場合は、カイ二乗近似が不正確になります。その場合は Fisher の正確検定を使います。

5. 検定手法の選び方

関連教材（青の統計学）

尤度比検定（動画）

検定の多重性（動画）

【等分散の仮定編】2標本問題をわかりやすく解説|推定と検定（記事）

目的とデータの種類に応じて、適切な検定を選びます。

データの種類は？
          ├── 量的データ（連続・離散）
          │   ├── 1群の平均を検定したい
          │   │   ├── σ既知 → z検定
          │   │   └── σ未知 → 一標本 t 検定
          │   └── 2群の平均差を検定したい
          │       ├── 対応あり（同一個体の前後など） → 対応のある t 検定
          │       └── 対応なし（独立した2群）       → 二標本 t 検定（Welch）
          └── カテゴリカルデータ（名義・順序）
              ├── 分布が理論値と合っているか → 適合度検定（χ²）
              └── 2変数が独立かどうか       → 独立性検定（χ²）

検定の選択ガイド

演習問題

問題1

ある工場の製品Aの直径の母標準偏差は $\sigma = 0.5$mm とわかっている。今日の生産から $n = 36$ 個を抜き取ったところ $\bar{x} = 10.3$mm だった。「母平均の直径は10mm」という帰無仮説を有意水準5%で両側検定せよ。

解答を見る

Step 1：$H_0: \mu = 10$、$H_1: \mu \neq 10$

Step 2：$\alpha = 0.05$

Step 3 検定統計量：

$z = \frac{10.3 - 10}{0.5 / \sqrt{36}} = \frac{0.3}{0.5/6} = \frac{0.3}{0.0833} \approx 3.60$

Step 4 判断：$|z| = 3.60 > 1.96$（両側5%の棄却限界値）

結論：帰無仮則を棄却します。有意水準5%で、母平均の直径は10mmでないと言えます。

参考：p値 $= 2 \times P(Z > 3.60) \approx 2 \times 0.00016 = 0.00032$ であり、非常に小さい値です。

問題2

ある塾が新しい学習法を導入した。生徒8名のテストスコアが以下の通りで、標本平均 $\bar{x} = 5.25$点の向上、標本標準偏差 $s = 4.0$ 点だった。「平均向上点はゼロ」という帰無仮説を有意水準5%で両側検定せよ（対応のある t 検定）。

解答を見る

これは同一生徒の「前後の差」を見るので、対応のある t 検定を使います。差スコア $d_i$ の標本平均 $\bar{d} = 5.25$、$s_d = 4.0$、$n = 8$。

Step 1：$H_0: \mu_d = 0$、$H_1: \mu_d \neq 0$

Step 2：$\alpha = 0.05$、自由度 $\nu = 8 - 1 = 7$

Step 3 検定統計量：

$t = \frac{5.25 - 0}{4.0 / \sqrt{8}} = \frac{5.25}{1.414} \approx 3.71$

Step 4 判断：自由度7の t 分布の両側5%臨界値は $t_{0.025}(7) = 2.365$。

$|t| = 3.71 > 2.365$ なので、帰無仮説を棄却します。

結論：有意水準5%で、新しい学習法による平均向上点はゼロでないと言えます。

問題3

あるアンケートで「新製品に興味がある」かどうかを男女各100名に聞いたところ、次の結果が得られた。性別と興味の有無は独立かどうかを有意水準5%で検定せよ。

	興味あり	興味なし	計
男性	40	60	100
女性	55	45	100
計	95	105	200

解答を見る

Step 1：$H_0$：性別と興味の有無は独立、$H_1$：独立でない

Step 2：$\alpha = 0.05$、自由度 $\nu = (2-1)(2-1) = 1$

Step 3 期待度数の計算：

$E_{11} = \frac{100 \times 95}{200} = 47.5, \quad E_{12} = \frac{100 \times 105}{200} = 52.5$

$E_{21} = \frac{100 \times 95}{200} = 47.5, \quad E_{22} = \frac{100 \times 105}{200} = 52.5$

検定統計量：

$\chi^2 = \frac{(40-47.5)^2}{47.5} + \frac{(60-52.5)^2}{52.5} + \frac{(55-47.5)^2}{47.5} + \frac{(45-52.5)^2}{52.5}$

$= \frac{56.25}{47.5} + \frac{56.25}{52.5} + \frac{56.25}{47.5} + \frac{56.25}{52.5}$

$= 1.184 + 1.071 + 1.184 + 1.071 = 4.510$

Step 4 判断：自由度1の $\chi^2$ 分布の5%臨界値は3.841。

$4.510 > 3.841$ なので、帰無仮説を棄却します。

結論：有意水準5%で、性別と新製品への興味は独立でない（関連がある）と言えます。

まとめ

検定手法	使う場面	統計量	従う分布
z検定	母平均の検定（σ既知）	$(\bar{x}-\mu_0)/(\sigma/\sqrt{n})$	$N(0,1)$
一標本 t 検定	母平均の検定（σ未知）	$(\bar{x}-\mu_0)/(s/\sqrt{n})$	$t(n-1)$
二標本 t 検定	2群の平均差	$(\bar{x}_1-\bar{x}_2)/SE$	$t(\nu)$
対応のある t 検定	前後差・ペアデータ	$\bar{d}/(s_d/\sqrt{n})$	$t(n-1)$
$\chi^2$ 適合度検定	分布の一致	$\sum(O-E)^2/E$	$\chi^2(k-1)$
$\chi^2$ 独立性検定	2変数の関連	$\sum(O-E)^2/E$	$\chi^2((r-1)(c-1))$

次の章では、母分散の比較に使うF分布と等分散検定を学びます。