第4章:主要な検定手法
Stage 4:標本から母集団へ
この章で学ぶこと
前章で仮説検定の論理的な枠組みを学びました。この章では、実際に使われる具体的な検定手法を扱います。
- z検定:母分散が既知のときの母平均検定
- t検定:母分散が未知のときの母平均検定(一標本・二標本)
- カイ二乗検定:カテゴリカルデータの検定
それぞれの手法がどのような状況で使われるかを理解し、手順を追って計算できるようになることを目標とします。
1. z検定(母分散が既知の場合)
関連教材(青の統計学)
概要
母集団の分散 $\sigma^2$ が既知のとき、母平均 $\mu$ に関する仮説を検定します。母集団が正規分布に従うか、標本サイズが十分に大きい($n \geq 30$ が目安)場合に使えます。
検定統計量
$z = \frac{\bar{x} - \mu_0}{\sigma / \sqrt{n}}$
- $\bar{x}$:標本平均
- $\mu_0$:帰無仮説で設定した母平均
- $\sigma$:母標準偏差(既知)
- $n$:標本サイズ
この $z$ 値は、帰無仮説のもとで標準正規分布 $N(0,1)$ に従います。
棄却域(両側検定、$\alpha = 0.05$)
$|z| > 1.96$

例題
ある工場の製品の重量は、過去のデータから母標準偏差 $\sigma = 10$g とわかっている。今日の生産ラインから $n = 25$ 個を抽出したところ、標本平均 $\bar{x} = 505$g だった。「母平均は500gである」という帰無仮説を $\alpha = 0.05$ で検定せよ。
Step 1 仮説設定
$H_0: \mu = 500, \quad H_1: \mu \neq 500 \quad \text{(両側検定)}$
Step 2 有意水準:$\alpha = 0.05$
Step 3 検定統計量
$z = \frac{505 - 500}{10 / \sqrt{25}} = \frac{5}{2} = 2.50$
Step 4 判断
$|z| = 2.50 > 1.96$ なので、帰無仮説を棄却します。
Step 5 結論:有意水準5%で、母平均が500gでないと結論できます。
2. 一標本 t 検定(母分散が未知の場合)
概要
現実には、母分散 $\sigma^2$ が既知であることはほとんどありません。そのため、$\sigma$ を標本標準偏差 $s$ で推定した場合は、z分布ではなくt分布を使います。
検定統計量
$t = \frac{\bar{x} - \mu_0}{s / \sqrt{n}}$
この統計量は、帰無仮説のもとで自由度 $\nu = n - 1$ の t分布に従います。
t分布と自由度
t分布は標準正規分布より裾が重い分布です。自由度が大きくなるほど標準正規分布に近づきます。
| 自由度 | 両側5%の棄却限界値 |
|---|---|
| 5 | 2.571 |
| 10 | 2.228 |
| 20 | 2.086 |
| 30 | 2.042 |
| ∞(標準正規) | 1.960 |

例題
あるコーヒーショップは「1杯あたりのカフェイン量は200mgである」と主張している。10杯を抽出して測定した結果、$\bar{x} = 212$mg、$s = 15$mg だった。$\alpha = 0.05$ で検定せよ。
Step 1 仮説設定
$H_0: \mu = 200, \quad H_1: \mu \neq 200$
Step 2 $\alpha = 0.05$、自由度 $\nu = 10 - 1 = 9$
Step 3 検定統計量
$t = \frac{212 - 200}{15 / \sqrt{10}} = \frac{12}{4.743} \approx 2.530$
Step 4 判断
自由度9の t 分布における両側5%の臨界値は $t_{0.025}(9) = 2.262$。
$|t| = 2.530 > 2.262$ なので、帰無仮説を棄却します。
Step 5 結論:有意水準5%で、母平均が200mgでないと結論できます。
3. 二標本 t 検定(二群の平均差の検定)
2つの独立したグループの平均を比較したいときに使います。
3-1. 独立標本 t 検定
等分散を仮定する場合(pooled t検定)
$t = \frac{\bar{x}_1 - \bar{x}_2}{s_p \sqrt{1/n_1 + 1/n_2}}, \quad s_p^2 = \frac{(n_1-1)s_1^2 + (n_2-1)s_2^2}{n_1+n_2-2}$
自由度:$\nu = n_1 + n_2 - 2$
等分散を仮定しない場合(Welch の t 検定)
$t = \frac{\bar{x}_1 - \bar{x}_2}{\sqrt{s_1^2/n_1 + s_2^2/n_2}}$
自由度は Welch-Satterthwaite の式で近似します(複雑なため統計ソフトに任せることが多い)。
実用的な指針:等分散かどうか不明なときは Welch の t 検定を使うのが安全です。等分散が成り立つ場合でも Welch 検定はほぼ同じ結果を与えます。
3-2. 対応のある t 検定(paired t検定)
同一の対象に対して2回測定した場合(例:投薬前後・左右の目)に使います。差 $d_i = x_{1i} - x_{2i}$ を計算し、一標本 t 検定を行います。
$t = \frac{\bar{d}}{s_d / \sqrt{n}}, \quad \nu = n - 1$
対応のあるデータを独立標本として扱うと、個体差が誤差として混入し、検出力が下がります。
4. カイ二乗検定($\chi^2$ 検定)
カテゴリカルデータ(名義尺度・順序尺度)に対して使う検定です。
4-1. 適合度検定(goodness of fit test)
「観測された度数分布が、期待される分布と合っているか」を検定します。
検定統計量
$\chi^2 = \sum_{i=1}^{k} \frac{(O_i - E_i)^2}{E_i}$
- $O_i$:観測度数(実際に数えた値)
- $E_i$:期待度数(帰無仮説のもとで期待される値)
- $k$:カテゴリ数
自由度:$\nu = k - 1$
例:サイコロを120回振ったとき、各目が20回ずつ出るか検定する。
| 目 | 1 | 2 | 3 | 4 | 5 | 6 |
|---|---|---|---|---|---|---|
| 観測 $O_i$ | 18 | 22 | 25 | 19 | 16 | 20 |
| 期待 $E_i$ | 20 | 20 | 20 | 20 | 20 | 20 |
$\chi^2 = \frac{(18-20)^2}{20} + \frac{(22-20)^2}{20} + \cdots + \frac{(20-20)^2}{20} = \frac{4+4+25+1+16+0}{20} = 2.50$
自由度5の $\chi^2$ 分布の5%臨界値は11.07。$2.50 < 11.07$ なので帰無仮説を棄却できません。
4-2. 独立性検定(test of independence)
「2つのカテゴリカル変数が独立かどうか」を検定します。クロス集計表(分割表)を使います。
例:性別と商品の好みが独立かどうかを検定する。
| 商品A好き | 商品B好き | 計 | |
|---|---|---|---|
| 男性 | 30 | 20 | 50 |
| 女性 | 25 | 25 | 50 |
| 計 | 55 | 45 | 100 |
期待度数(行合計 × 列合計 ÷ 総計):
$E_{11} = \frac{50 \times 55}{100} = 27.5, \quad E_{12} = \frac{50 \times 45}{100} = 22.5$
$\chi^2 = \sum \frac{(O - E)^2}{E} = \frac{(30-27.5)^2}{27.5} + \frac{(20-22.5)^2}{22.5} + \frac{(25-27.5)^2}{27.5} + \frac{(25-22.5)^2}{22.5}$
$= 0.227 + 0.278 + 0.227 + 0.278 = 1.010$
自由度:$\nu = (\text{行数}-1) \times (\text{列数}-1) = 1 \times 1 = 1$
$\chi^2$ 分布の自由度1・5%臨界値は3.84。$1.010 < 3.84$ なので独立性を棄却できません。

注意:期待度数が5未満のセルが多い場合は、カイ二乗近似が不正確になります。その場合は Fisher の正確検定を使います。
5. 検定手法の選び方
関連教材(青の統計学)
目的とデータの種類に応じて、適切な検定を選びます。
データの種類は?
├── 量的データ(連続・離散)
│ ├── 1群の平均を検定したい
│ │ ├── σ既知 → z検定
│ │ └── σ未知 → 一標本 t 検定
│ └── 2群の平均差を検定したい
│ ├── 対応あり(同一個体の前後など) → 対応のある t 検定
│ └── 対応なし(独立した2群) → 二標本 t 検定(Welch)
└── カテゴリカルデータ(名義・順序)
├── 分布が理論値と合っているか → 適合度検定(χ²)
└── 2変数が独立かどうか → 独立性検定(χ²)

演習問題
問題1
ある工場の製品Aの直径の母標準偏差は $\sigma = 0.5$mm とわかっている。今日の生産から $n = 36$ 個を抜き取ったところ $\bar{x} = 10.3$mm だった。「母平均の直径は10mm」という帰無仮説を有意水準5%で両側検定せよ。
解答を見る
Step 1:$H_0: \mu = 10$、$H_1: \mu \neq 10$
Step 2:$\alpha = 0.05$
Step 3 検定統計量:
$z = \frac{10.3 - 10}{0.5 / \sqrt{36}} = \frac{0.3}{0.5/6} = \frac{0.3}{0.0833} \approx 3.60$
Step 4 判断:$|z| = 3.60 > 1.96$(両側5%の棄却限界値)
結論:帰無仮則を棄却します。有意水準5%で、母平均の直径は10mmでないと言えます。
参考:p値 $= 2 \times P(Z > 3.60) \approx 2 \times 0.00016 = 0.00032$ であり、非常に小さい値です。
問題2
ある塾が新しい学習法を導入した。生徒8名のテストスコアが以下の通りで、標本平均 $\bar{x} = 5.25$点の向上、標本標準偏差 $s = 4.0$ 点だった。「平均向上点はゼロ」という帰無仮説を有意水準5%で両側検定せよ(対応のある t 検定)。
解答を見る
これは同一生徒の「前後の差」を見るので、対応のある t 検定を使います。差スコア $d_i$ の標本平均 $\bar{d} = 5.25$、$s_d = 4.0$、$n = 8$。
Step 1:$H_0: \mu_d = 0$、$H_1: \mu_d \neq 0$
Step 2:$\alpha = 0.05$、自由度 $\nu = 8 - 1 = 7$
Step 3 検定統計量:
$t = \frac{5.25 - 0}{4.0 / \sqrt{8}} = \frac{5.25}{1.414} \approx 3.71$
Step 4 判断:自由度7の t 分布の両側5%臨界値は $t_{0.025}(7) = 2.365$。
$|t| = 3.71 > 2.365$ なので、帰無仮説を棄却します。
結論:有意水準5%で、新しい学習法による平均向上点はゼロでないと言えます。
問題3
あるアンケートで「新製品に興味がある」かどうかを男女各100名に聞いたところ、次の結果が得られた。性別と興味の有無は独立かどうかを有意水準5%で検定せよ。
| 興味あり | 興味なし | 計 | |
|---|---|---|---|
| 男性 | 40 | 60 | 100 |
| 女性 | 55 | 45 | 100 |
| 計 | 95 | 105 | 200 |
解答を見る
Step 1:$H_0$:性別と興味の有無は独立、$H_1$:独立でない
Step 2:$\alpha = 0.05$、自由度 $\nu = (2-1)(2-1) = 1$
Step 3 期待度数の計算:
$E_{11} = \frac{100 \times 95}{200} = 47.5, \quad E_{12} = \frac{100 \times 105}{200} = 52.5$
$E_{21} = \frac{100 \times 95}{200} = 47.5, \quad E_{22} = \frac{100 \times 105}{200} = 52.5$
検定統計量:
$\chi^2 = \frac{(40-47.5)^2}{47.5} + \frac{(60-52.5)^2}{52.5} + \frac{(55-47.5)^2}{47.5} + \frac{(45-52.5)^2}{52.5}$
$= \frac{56.25}{47.5} + \frac{56.25}{52.5} + \frac{56.25}{47.5} + \frac{56.25}{52.5}$
$= 1.184 + 1.071 + 1.184 + 1.071 = 4.510$
Step 4 判断:自由度1の $\chi^2$ 分布の5%臨界値は3.841。
$4.510 > 3.841$ なので、帰無仮説を棄却します。
結論:有意水準5%で、性別と新製品への興味は独立でない(関連がある)と言えます。
まとめ
| 検定手法 | 使う場面 | 統計量 | 従う分布 |
|---|---|---|---|
| z検定 | 母平均の検定(σ既知) | $(\bar{x}-\mu_0)/(\sigma/\sqrt{n})$ | $N(0,1)$ |
| 一標本 t 検定 | 母平均の検定(σ未知) | $(\bar{x}-\mu_0)/(s/\sqrt{n})$ | $t(n-1)$ |
| 二標本 t 検定 | 2群の平均差 | $(\bar{x}_1-\bar{x}_2)/SE$ | $t(\nu)$ |
| 対応のある t 検定 | 前後差・ペアデータ | $\bar{d}/(s_d/\sqrt{n})$ | $t(n-1)$ |
| $\chi^2$ 適合度検定 | 分布の一致 | $\sum(O-E)^2/E$ | $\chi^2(k-1)$ |
| $\chi^2$ 独立性検定 | 2変数の関連 | $\sum(O-E)^2/E$ | $\chi^2((r-1)(c-1))$ |
次の章では、母分散の比較に使うF分布と等分散検定を学びます。