青の統計学-DS Playground-

第4章:主要な検定手法

Stage 4:標本から母集団へ


この章で学ぶこと

前章で仮説検定の論理的な枠組みを学びました。この章では、実際に使われる具体的な検定手法を扱います。

  • z検定:母分散が既知のときの母平均検定
  • t検定:母分散が未知のときの母平均検定(一標本・二標本)
  • カイ二乗検定:カテゴリカルデータの検定

それぞれの手法がどのような状況で使われるかを理解し、手順を追って計算できるようになることを目標とします。


1. z検定(母分散が既知の場合)

関連教材(青の統計学)

概要

母集団の分散 $\sigma^2$ が既知のとき、母平均 $\mu$ に関する仮説を検定します。母集団が正規分布に従うか、標本サイズが十分に大きい($n \geq 30$ が目安)場合に使えます。

検定統計量

$z = \frac{\bar{x} - \mu_0}{\sigma / \sqrt{n}}$

  • $\bar{x}$:標本平均
  • $\mu_0$:帰無仮説で設定した母平均
  • $\sigma$:母標準偏差(既知)
  • $n$:標本サイズ

この $z$ 値は、帰無仮説のもとで標準正規分布 $N(0,1)$ に従います。

棄却域(両側検定、$\alpha = 0.05$)

$|z| > 1.96$

両側検定の棄却域

例題

ある工場の製品の重量は、過去のデータから母標準偏差 $\sigma = 10$g とわかっている。今日の生産ラインから $n = 25$ 個を抽出したところ、標本平均 $\bar{x} = 505$g だった。「母平均は500gである」という帰無仮説を $\alpha = 0.05$ で検定せよ。

Step 1 仮説設定

$H_0: \mu = 500, \quad H_1: \mu \neq 500 \quad \text{(両側検定)}$

Step 2 有意水準:$\alpha = 0.05$

Step 3 検定統計量

$z = \frac{505 - 500}{10 / \sqrt{25}} = \frac{5}{2} = 2.50$

Step 4 判断

$|z| = 2.50 > 1.96$ なので、帰無仮説を棄却します。

Step 5 結論:有意水準5%で、母平均が500gでないと結論できます。


2. 一標本 t 検定(母分散が未知の場合)

概要

現実には、母分散 $\sigma^2$ が既知であることはほとんどありません。そのため、$\sigma$ を標本標準偏差 $s$ で推定した場合は、z分布ではなくt分布を使います。

検定統計量

$t = \frac{\bar{x} - \mu_0}{s / \sqrt{n}}$

この統計量は、帰無仮説のもとで自由度 $\nu = n - 1$ の t分布に従います。

t分布と自由度

t分布は標準正規分布より裾が重い分布です。自由度が大きくなるほど標準正規分布に近づきます。

自由度 両側5%の棄却限界値
5 2.571
10 2.228
20 2.086
30 2.042
∞(標準正規) 1.960

自由度によるt分布の変化

例題

あるコーヒーショップは「1杯あたりのカフェイン量は200mgである」と主張している。10杯を抽出して測定した結果、$\bar{x} = 212$mg、$s = 15$mg だった。$\alpha = 0.05$ で検定せよ。

Step 1 仮説設定

$H_0: \mu = 200, \quad H_1: \mu \neq 200$

Step 2 $\alpha = 0.05$、自由度 $\nu = 10 - 1 = 9$

Step 3 検定統計量

$t = \frac{212 - 200}{15 / \sqrt{10}} = \frac{12}{4.743} \approx 2.530$

Step 4 判断

自由度9の t 分布における両側5%の臨界値は $t_{0.025}(9) = 2.262$。

$|t| = 2.530 > 2.262$ なので、帰無仮説を棄却します。

Step 5 結論:有意水準5%で、母平均が200mgでないと結論できます。


3. 二標本 t 検定(二群の平均差の検定)

2つの独立したグループの平均を比較したいときに使います。

3-1. 独立標本 t 検定

等分散を仮定する場合(pooled t検定)

$t = \frac{\bar{x}_1 - \bar{x}_2}{s_p \sqrt{1/n_1 + 1/n_2}}, \quad s_p^2 = \frac{(n_1-1)s_1^2 + (n_2-1)s_2^2}{n_1+n_2-2}$

自由度:$\nu = n_1 + n_2 - 2$

等分散を仮定しない場合(Welch の t 検定)

$t = \frac{\bar{x}_1 - \bar{x}_2}{\sqrt{s_1^2/n_1 + s_2^2/n_2}}$

自由度は Welch-Satterthwaite の式で近似します(複雑なため統計ソフトに任せることが多い)。

実用的な指針:等分散かどうか不明なときは Welch の t 検定を使うのが安全です。等分散が成り立つ場合でも Welch 検定はほぼ同じ結果を与えます。

3-2. 対応のある t 検定(paired t検定)

同一の対象に対して2回測定した場合(例:投薬前後・左右の目)に使います。差 $d_i = x_{1i} - x_{2i}$ を計算し、一標本 t 検定を行います。

$t = \frac{\bar{d}}{s_d / \sqrt{n}}, \quad \nu = n - 1$

対応のあるデータを独立標本として扱うと、個体差が誤差として混入し、検出力が下がります。


4. カイ二乗検定($\chi^2$ 検定)

カテゴリカルデータ(名義尺度・順序尺度)に対して使う検定です。

4-1. 適合度検定(goodness of fit test)

「観測された度数分布が、期待される分布と合っているか」を検定します。

検定統計量

$\chi^2 = \sum_{i=1}^{k} \frac{(O_i - E_i)^2}{E_i}$

  • $O_i$:観測度数(実際に数えた値)
  • $E_i$:期待度数(帰無仮説のもとで期待される値)
  • $k$:カテゴリ数

自由度:$\nu = k - 1$

:サイコロを120回振ったとき、各目が20回ずつ出るか検定する。

1 2 3 4 5 6
観測 $O_i$ 18 22 25 19 16 20
期待 $E_i$ 20 20 20 20 20 20

$\chi^2 = \frac{(18-20)^2}{20} + \frac{(22-20)^2}{20} + \cdots + \frac{(20-20)^2}{20} = \frac{4+4+25+1+16+0}{20} = 2.50$

自由度5の $\chi^2$ 分布の5%臨界値は11.07。$2.50 < 11.07$ なので帰無仮説を棄却できません。

4-2. 独立性検定(test of independence)

「2つのカテゴリカル変数が独立かどうか」を検定します。クロス集計表(分割表)を使います。

:性別と商品の好みが独立かどうかを検定する。

商品A好き 商品B好き
男性 30 20 50
女性 25 25 50
55 45 100

期待度数(行合計 × 列合計 ÷ 総計):

$E_{11} = \frac{50 \times 55}{100} = 27.5, \quad E_{12} = \frac{50 \times 45}{100} = 22.5$

$\chi^2 = \sum \frac{(O - E)^2}{E} = \frac{(30-27.5)^2}{27.5} + \frac{(20-22.5)^2}{22.5} + \frac{(25-27.5)^2}{27.5} + \frac{(25-22.5)^2}{22.5}$

$= 0.227 + 0.278 + 0.227 + 0.278 = 1.010$

自由度:$\nu = (\text{行数}-1) \times (\text{列数}-1) = 1 \times 1 = 1$

$\chi^2$ 分布の自由度1・5%臨界値は3.84。$1.010 < 3.84$ なので独立性を棄却できません。

カイ二乗分布と棄却域

注意:期待度数が5未満のセルが多い場合は、カイ二乗近似が不正確になります。その場合は Fisher の正確検定を使います。


5. 検定手法の選び方

関連教材(青の統計学)

目的とデータの種類に応じて、適切な検定を選びます。

データの種類は?
          ├── 量的データ(連続・離散)
          │   ├── 1群の平均を検定したい
          │   │   ├── σ既知 → z検定
          │   │   └── σ未知 → 一標本 t 検定
          │   └── 2群の平均差を検定したい
          │       ├── 対応あり(同一個体の前後など) → 対応のある t 検定
          │       └── 対応なし(独立した2群)       → 二標本 t 検定(Welch)
          └── カテゴリカルデータ(名義・順序)
              ├── 分布が理論値と合っているか → 適合度検定(χ²)
              └── 2変数が独立かどうか       → 独立性検定(χ²)
          

検定の選択ガイド


演習問題

問題1

ある工場の製品Aの直径の母標準偏差は $\sigma = 0.5$mm とわかっている。今日の生産から $n = 36$ 個を抜き取ったところ $\bar{x} = 10.3$mm だった。「母平均の直径は10mm」という帰無仮説を有意水準5%で両側検定せよ。

解答を見る

Step 1:$H_0: \mu = 10$、$H_1: \mu \neq 10$

Step 2:$\alpha = 0.05$

Step 3 検定統計量

$z = \frac{10.3 - 10}{0.5 / \sqrt{36}} = \frac{0.3}{0.5/6} = \frac{0.3}{0.0833} \approx 3.60$

Step 4 判断:$|z| = 3.60 > 1.96$(両側5%の棄却限界値)

結論:帰無仮則を棄却します。有意水準5%で、母平均の直径は10mmでないと言えます。

参考:p値 $= 2 \times P(Z > 3.60) \approx 2 \times 0.00016 = 0.00032$ であり、非常に小さい値です。


問題2

ある塾が新しい学習法を導入した。生徒8名のテストスコアが以下の通りで、標本平均 $\bar{x} = 5.25$点の向上、標本標準偏差 $s = 4.0$ 点だった。「平均向上点はゼロ」という帰無仮説を有意水準5%で両側検定せよ(対応のある t 検定)。

解答を見る

これは同一生徒の「前後の差」を見るので、対応のある t 検定を使います。差スコア $d_i$ の標本平均 $\bar{d} = 5.25$、$s_d = 4.0$、$n = 8$。

Step 1:$H_0: \mu_d = 0$、$H_1: \mu_d \neq 0$

Step 2:$\alpha = 0.05$、自由度 $\nu = 8 - 1 = 7$

Step 3 検定統計量

$t = \frac{5.25 - 0}{4.0 / \sqrt{8}} = \frac{5.25}{1.414} \approx 3.71$

Step 4 判断:自由度7の t 分布の両側5%臨界値は $t_{0.025}(7) = 2.365$。

$|t| = 3.71 > 2.365$ なので、帰無仮説を棄却します。

結論:有意水準5%で、新しい学習法による平均向上点はゼロでないと言えます。


問題3

あるアンケートで「新製品に興味がある」かどうかを男女各100名に聞いたところ、次の結果が得られた。性別と興味の有無は独立かどうかを有意水準5%で検定せよ。

興味あり 興味なし
男性 40 60 100
女性 55 45 100
95 105 200
解答を見る

Step 1:$H_0$:性別と興味の有無は独立、$H_1$:独立でない

Step 2:$\alpha = 0.05$、自由度 $\nu = (2-1)(2-1) = 1$

Step 3 期待度数の計算

$E_{11} = \frac{100 \times 95}{200} = 47.5, \quad E_{12} = \frac{100 \times 105}{200} = 52.5$

$E_{21} = \frac{100 \times 95}{200} = 47.5, \quad E_{22} = \frac{100 \times 105}{200} = 52.5$

検定統計量

$\chi^2 = \frac{(40-47.5)^2}{47.5} + \frac{(60-52.5)^2}{52.5} + \frac{(55-47.5)^2}{47.5} + \frac{(45-52.5)^2}{52.5}$

$= \frac{56.25}{47.5} + \frac{56.25}{52.5} + \frac{56.25}{47.5} + \frac{56.25}{52.5}$

$= 1.184 + 1.071 + 1.184 + 1.071 = 4.510$

Step 4 判断:自由度1の $\chi^2$ 分布の5%臨界値は3.841。

$4.510 > 3.841$ なので、帰無仮説を棄却します。

結論:有意水準5%で、性別と新製品への興味は独立でない(関連がある)と言えます。


まとめ

検定手法 使う場面 統計量 従う分布
z検定 母平均の検定(σ既知) $(\bar{x}-\mu_0)/(\sigma/\sqrt{n})$ $N(0,1)$
一標本 t 検定 母平均の検定(σ未知) $(\bar{x}-\mu_0)/(s/\sqrt{n})$ $t(n-1)$
二標本 t 検定 2群の平均差 $(\bar{x}_1-\bar{x}_2)/SE$ $t(\nu)$
対応のある t 検定 前後差・ペアデータ $\bar{d}/(s_d/\sqrt{n})$ $t(n-1)$
$\chi^2$ 適合度検定 分布の一致 $\sum(O-E)^2/E$ $\chi^2(k-1)$
$\chi^2$ 独立性検定 2変数の関連 $\sum(O-E)^2/E$ $\chi^2((r-1)(c-1))$

次の章では、母分散の比較に使うF分布と等分散検定を学びます。