p値と仮説検定とは?
仮説検定は、データに基づいて特定の仮説(主張)が正しいかどうかを統計的に判断する手続きです。通常、帰無仮説 (H₀)(例: 「薬の効果はない」)と対立仮説 (H₁)(例: 「薬の効果はある」)を設定します。
p値 (P-value) は、仮説検定における重要な指標で、「帰無仮説 H₀ が正しいと仮定した場合に、観測されたデータ(またはそれ以上に極端なデータ)が得られる確率」を示します。
- p値が小さい → 観測データは H₀ の下では非常に珍しい → H₀ は疑わしい
- p値が大きい → 観測データは H₀ の下でも起こりうる → H₀ を棄却する根拠は弱い
検定者は事前に有意水準 (\(\alpha\))(通常0.05)を定め、p値が有意水準より小さい (p < \(\alpha\)) 場合に H₀ を棄却し、H₁ を採択します。
両側検定 (Two-tailed Test) のp値計算
両側検定は、対立仮説が「差がある」や「異なる」(方向は問わない)という場合に行われます。例えば H₁: 「平均値は特定の値と異なる」などです。
観測された検定統計量 \(Z_{obs}\) が得られたとき、両側p値は、\(Z_{obs}\) と同じくらい、またはそれ以上に「極端な」(0から遠い)値が、分布の両側の裾で得られる確率の合計です。
標準正規分布は対称的なので、計算は以下のようになります。
$ p \text{-value} = P(Z \ge |Z_{obs}|) + P(Z \le -|Z_{obs}|) = 2 \times P(Z \ge |Z_{obs}|)$
計算ステップ
与えられた情報:
- 観測されたZ統計量: \(Z_{obs} = 2.5\)
- 検定の種類: 両側検定
- 片側確率: \(P(Z > 2.5) = 0.0062\)
1. 片側確率の確認: 分布の右側の裾の面積が \(P(Z \ge |Z_{obs}|) = P(Z \ge 2.5) \approx 0.0062\) です。
2. p値の計算: 両側検定なので、この片側確率を2倍します。
$p \text{-value} = 2 \times P(Z \ge 2.5) \
\approx 2 \times 0.0062 = 0.0124$
したがって、両側のp値は約 0.0124 です。
重要ポイント:p値の解釈と注意点
- 結果の解釈: このp値 (0.0124) が有意水準 \(\alpha = 0.05\) より小さい場合、帰無仮説は棄却され、「統計的に有意な結果である」と結論づけられます。
- p値 ≠ 帰無仮説が真である確率: p値は「H₀ が真である確率」ではありません。あくまで「H₀ が真と仮定した下でのデータの珍しさ」を示す指標です。
- 片側検定 vs 両側検定: 対立仮説が方向性を持つ(例: H₁: 「平均値は特定の値より大きい」)場合は片側検定を行い、p値は片側の裾の面積のみで計算します。
- 有意水準: \(\alpha\) の選択は、第1種の誤り(H₀が真なのに棄却する誤り)を許容する確率を決定します。