青の統計学-DS Playground-

第5章:母分散の検定

Stage 4:標本から母集団へ


この章で学ぶこと

これまで母平均に関する検定を学んできました。この章では母分散に注目します。

「ばらつきが大きすぎないか」「2つのグループのばらつきは同程度か」——こうした問いに答えるのが母分散の検定です。分散の検定は、品質管理・二標本 t 検定の前提確認・分散分析(ANOVA)の前処理として実際によく使われます。


1. なぜ分散を検定するか

品質管理の視点

製品の寸法の平均が規格通りでも、ばらつきが大きければ不良品が増えます。

例:ボルトの直径の目標値は10mm、許容誤差は±0.1mm。標本の標準偏差が0.05mmなら問題ないですが、0.15mmなら規格外品が多数発生します。

二標本 t 検定の前提確認

pooled t 検定(等分散を仮定した二標本 t 検定)を使うには、「2つの群の母分散が等しい」という前提が必要です。これを事前に確認するのが等分散検定です。


2. 一標本の分散検定($\chi^2$ 検定)

関連教材(青の統計学)

概要

「母分散は $\sigma_0^2$ である」という帰無仮説を検定します。母集団が正規分布に従う場合に使えます。

検定統計量

$\chi^2 = \frac{(n-1)s^2}{\sigma_0^2}$

  • $n$:標本サイズ
  • $s^2$:標本不偏分散
  • $\sigma_0^2$:帰無仮説で設定した母分散

この統計量は、帰無仮説のもとで自由度 $\nu = n - 1$ のカイ二乗分布に従います。

カイ二乗分布の形状

カイ二乗分布は非対称(右に裾を引く形)で、必ず正の値をとります。自由度が大きくなるほど左右対称な形に近づきます。

カイ二乗分布 ── 自由度による形状変化

棄却域

検定の種類 棄却域
両側検定($H_1: \sigma^2 \neq \sigma_0^2$) $\chi^2 < \chi^2_{1-\alpha/2}(\nu)$ または $\chi^2 > \chi^2_{\alpha/2}(\nu)$
右側検定($H_1: \sigma^2 > \sigma_0^2$) $\chi^2 > \chi^2_{\alpha}(\nu)$
左側検定($H_1: \sigma^2 < \sigma_0^2$) $\chi^2 < \chi^2_{1-\alpha}(\nu)$

カイ二乗分布は非対称なため、両側検定では上側・下側のパーセント点をそれぞれ別に求めます。

例題

ある機械部品の製造工程について、過去のデータから母分散は $\sigma_0^2 = 4$($\sigma_0 = 2$mm)であることが知られている。設備更新後に $n = 21$ 個を抽出したところ、$s^2 = 6.5$ だった。母分散が変化したかどうかを有意水準5%で両側検定せよ。

Step 1:$H_0: \sigma^2 = 4$、$H_1: \sigma^2 \neq 4$

Step 2:$\alpha = 0.05$、自由度 $\nu = 20$

Step 3 検定統計量

$\chi^2 = \frac{20 \times 6.5}{4} = \frac{130}{4} = 32.5$

Step 4 棄却域の確認

自由度20の $\chi^2$ 分布における棄却限界値(両側5%):

  • 下側:$\chi^2_{0.975}(20) = 9.591$
  • 上側:$\chi^2_{0.025}(20) = 34.170$

$9.591 < 32.5 < 34.170$ なので、棄却域に入りません。

結論:有意水準5%で、母分散が変化したとは言えません。


3. F 分布とは

定義

$\chi^2$ 分布に従う2つの独立な確率変数の比から生まれる分布が F 分布です。

$F = \frac{\chi^2(\nu_1) / \nu_1}{\chi^2(\nu_2) / \nu_2}$

2つの標本の不偏分散の比で考えると:

$F = \frac{s_1^2 / \sigma_1^2}{s_2^2 / \sigma_2^2}$

帰無仮説 $\sigma_1^2 = \sigma_2^2$ のもとでは:

$F = \frac{s_1^2}{s_2^2}$

これが自由度 $(\nu_1, \nu_2) = (n_1-1, n_2-1)$ の F 分布に従います。

F 分布の形状

  • 定義域は正の実数($F > 0$)
  • 右に裾を引く非対称な形
  • $\nu_1, \nu_2$ が大きくなるほど左右対称に近づく

F分布と棄却域

F 分布表の読み方

F 分布表では、分子の自由度($\nu_1$)と分母の自由度($\nu_2$)の組み合わせで上側パーセント点を読みます。

$\nu_1 \backslash \nu_2$ 10 20 30
5 3.33 2.77 2.53
10 2.98 2.35 2.16
20 2.77 2.12 1.93

(上側5%点の値)

下側パーセント点は、分子・分母を入れ替えて上側点を取る方法で求めます:

$F_{1-\alpha/2}(\nu_1, \nu_2) = \frac{1}{F_{\alpha/2}(\nu_2, \nu_1)}$


4. F 検定(等分散検定)

概要

2つの独立した正規母集団の分散が等しいかどうかを検定します。

$H_0: \sigma_1^2 = \sigma_2^2, \quad H_1: \sigma_1^2 \neq \sigma_2^2$

検定統計量

$F = \frac{s_1^2}{s_2^2}$

慣例として $s_1^2 \geq s_2^2$ になるように(分散が大きい方を分子にして)計算し、上側のみで判断する方法もありますが、厳密には両側検定が必要です。

例題

工場Aと工場Bの製品の品質を比較する。それぞれ $n_A = 16$、$n_B = 11$ の標本を抽出したところ、$s_A^2 = 12.0$、$s_B^2 = 5.0$ だった。2つの工場の母分散が等しいかどうかを有意水準10%で検定せよ。

Step 1:$H_0: \sigma_A^2 = \sigma_B^2$、$H_1: \sigma_A^2 \neq \sigma_B^2$

Step 2:$\alpha = 0.10$、$\nu_1 = 15$(分子)、$\nu_2 = 10$(分母)

Step 3 検定統計量

$F = \frac{s_A^2}{s_B^2} = \frac{12.0}{5.0} = 2.40$

Step 4 棄却域の確認

$F$ 分布($\nu_1 = 15, \nu_2 = 10$)の上側5%点(両側10%検定)は約2.85(統計表より)。

$F = 2.40 < 2.85$ なので、棄却域に入りません。

結論:有意水準10%で、2つの工場の母分散が等しくないとは言えません。


5. Levene 検定と正規性への依存

関連教材(青の統計学)

F 検定の弱点

F 検定は母集団が正規分布に従うという前提に大きく依存します。正規性が崩れると、F 検定の結果が信頼できなくなります。

Levene 検定(頑健な等分散検定)

正規性の仮定が疑わしい場合に使われる、より頑健な検定方法です。

各観測値から群の中央値(または平均)を引いた絶対偏差に対して一元配置分散分析を適用します。

$z_{ij} = |x_{ij} - \tilde{x}_j|$

この $z_{ij}$ に対して一元配置 ANOVA の F 統計量を計算します。

検定 正規性仮定 特徴
F 検定 強く依存 計算が単純・正規分布なら最も検出力が高い
Levene 検定 ほぼ不要 正規性が崩れても頑健・実用上よく使われる
Bartlett 検定 依存 3群以上に対応・正規性が必要

実用上の指針

  • データが正規分布に近いと判断できる場合:F 検定で十分
  • 正規性が不確かな場合:Levene 検定が安全
  • 統計ソフトを使う場合:Welch の t 検定を使えば等分散の前提が不要なので、等分散検定自体を省略できることも多い

📘 補足:分散の検定は慎重に使う

等分散検定で「有意でなかった」からといって「等分散が証明された」とは言えません(帰無仮説を棄却できなかっただけで、差がないとは言えない)。

特に標本サイズが小さい場合は検出力が低く、大きなばらつきの差があっても検出できないことがあります。

実用的には:

  • 二標本 t 検定にはWelch 検定を既定で使う(等分散を仮定しない方)が安全です
  • 等分散の確認が必須なのは、分散分析(ANOVA)など等分散を前提とする手法の場合です

演習問題

問題1

ある生産ラインの製品の重さのばらつきについて、母分散の基準値は $\sigma_0^2 = 9$($\sigma_0 = 3$g)とされている。品質検査で $n = 25$ 個を抽出したところ $s^2 = 15$ だった。母分散が基準値を超えているかどうかを有意水準5%で右側検定せよ。

解答を見る

Step 1:$H_0: \sigma^2 = 9$、$H_1: \sigma^2 > 9$(右側検定)

Step 2:$\alpha = 0.05$、自由度 $\nu = 24$

Step 3 検定統計量

$\chi^2 = \frac{(25-1) \times 15}{9} = \frac{24 \times 15}{9} = \frac{360}{9} = 40.0$

Step 4 棄却域の確認

自由度24の $\chi^2$ 分布の上側5%点:$\chi^2_{0.05}(24) = 36.415$(統計表より)

$\chi^2 = 40.0 > 36.415$ なので、棄却域に入ります。

結論:有意水準5%で、母分散が基準値を超えていると言えます。品質管理上のばらつきが増大している可能性があります。


問題2

2つの測定装置Xと装置Yの精度(ばらつき)を比較した。それぞれ $n_X = 13$、$n_Y = 11$ の測定値から $s_X^2 = 8.4$、$s_Y^2 = 3.2$ が得られた。2つの装置の母分散が等しいかどうかを有意水準5%で両側検定せよ。

解答を見る

Step 1:$H_0: \sigma_X^2 = \sigma_Y^2$、$H_1: \sigma_X^2 \neq \sigma_Y^2$

Step 2:$\alpha = 0.05$、$\nu_1 = 12$(分子 = Xの自由度)、$\nu_2 = 10$(分母 = Yの自由度)

Step 3 検定統計量

$F = \frac{s_X^2}{s_Y^2} = \frac{8.4}{3.2} = 2.625$

Step 4 棄却域の確認

F 分布($\nu_1 = 12, \nu_2 = 10$)の上側2.5%点(両側5%検定)は約3.37(統計表より)。

$F = 2.625 < 3.37$ なので、棄却域に入りません。

結論:有意水準5%で、2つの装置の母分散が等しくないとは言えません。ただし、検出力が低いため「等分散が証明された」とは言えないことに注意が必要です。


問題3(考察問題)

二標本 t 検定を行うとき、等分散検定で「有意差なし」という結果が出た場合、「母分散は等しいと証明されたのでpooled t 検定を使うべきだ」という判断は適切か。理由とともに答えてください。

解答を見る

適切ではありません。

「有意差なし」は「帰無仮説を棄却できなかった」ことを意味するだけで、「等分散が証明された」ことにはなりません。

特に標本サイズが小さいとき、等分散検定の検出力は低くなります。つまり、真の分散比がある程度大きくても検出できないことがあります。

推奨される判断

Welch の t 検定(等分散を仮定しない方)を既定で使うことが、より安全な選択です。等分散が成り立つ場合でも Welch 検定の結果は pooled t 検定と大きく変わらないため、「常に Welch を使う」という方針を採る研究者も多くいます。

等分散を前提にすることが必要な場面(分散分析など)では、より大きな標本サイズで慎重に判断することが重要です。


まとめ

手法 目的 統計量 分布
$\chi^2$ 検定(一標本) 母分散の検定 $(n-1)s^2/\sigma_0^2$ $\chi^2(n-1)$
F 検定(二標本) 等分散検定 $s_1^2/s_2^2$ $F(n_1-1, n_2-1)$
Levene 検定 等分散検定(頑健版) ANOVA の F 統計量 $F(\cdot)$
  • 分散の検定は正規性の仮定に依存する点に注意
  • 二標本 t 検定では Welch 法を使えば等分散検定を省略できる

次の章では、複数の仮説を同時に検定するときの問題点と対処法——多重検定と検出力を学びます。