p値の正しい解釈について考えましょう。
1. p値の定義
p値は、帰無仮説が真であると仮定したとき、観測されたデータまたはそれよりも極端なデータが得られる確率です。つまり、p値は「データが帰無仮説と矛盾する程度」を確率として表したものです。
$p\text{値} = P(\text{観測データ以上に極端なデータ} | H_0\text{が真})$
2. p値の誤った解釈
p値についてよくある誤解を確認しましょう:
- 誤解1:p値は帰無仮説が真である確率ではありません。頻度論的統計学では、帰無仮説は真か偽かのどちらかであり、確率的な表現はできません。
- 誤解2:p値は対立仮説が真である確率でもありません。同様に、対立仮説も確率的に表現することはできません。
- 誤解3:p値は「誤った結論を得る確率」ではありません。p値は特定のデータセットに対する計算結果であり、将来の検定結果を予測するものではありません。
- 誤解4:p値は母集団の特性を直接表すものではありません。
3. p値の正しい解釈
p値が0.03であるということは、帰無仮説が真であると仮定したとき、観測されたデータまたはそれよりも極端なデータが得られる確率が3%であることを意味します。
一般的に、p値が小さいほど(通常は0.05や0.01未満)、帰無仮説と観測データの間の不一致が大きいと考えられ、帰無仮説を棄却する根拠となります。
4. 選択肢の検討
- 「帰無仮説が真である確率は3%である」→ 誤り。p値は帰無仮説が真である確率ではありません。
- 「対立仮説が真である確率は97%である」→ 誤り。p値は対立仮説が真である確率ではありません。
- 「帰無仮説が真であるとき、観測されたデータまたはそれよりも極端なデータが得られる確率は3%である」→ 正しい。これがp値の正確な定義です。
- 「検定を100回繰り返すと、3回は誤った結論を得る」→ 誤り。p値は将来の検定結果を予測するものではありません。
- 「母集団の3%が帰無仮説を満たしている」→ 誤り。p値は母集団の特性を直接表すものではありません。
p値は仮説検定の結果を解釈する上で重要な指標ですが、その意味は直感的に理解しにくいことがあります。p値が小さいことは帰無仮説に対する証拠を提供しますが、効果の大きさや実質的な重要性を直接示すものではないことに注意が必要です。
したがって、p値が0.03であるという結果の最も適切な解釈は「帰無仮説が真であるとき、観測されたデータまたはそれよりも極端なデータが得られる確率は3%である」です。