分布の形状を表す指標である歪度と尖度の意味を理解しているかを問う問題です。
歪度は分布の左右対称性、尖度は分布の尖り具合や裾の重さを示します。正規分布を基準(歪度0、尖度3)として評価します。
1. 歪度 (Skewness)
歪度は、確率分布やデータセットの非対称性の度合いを示す指標です。
- 歪度 = 0:左右対称な分布(例:正規分布)。平均値と中央値がほぼ一致します。
- 歪度 > 0 (正の歪み):分布の右側に裾が長く伸びている(右に歪んでいる)。平均値が中央値よりも大きくなる傾向があります。少数の大きな値に引っ張られます。
- 歪度 < 0 (負の歪み):分布の左側に裾が長く伸びている(左に歪んでいる)。平均値が中央値よりも小さくなる傾向があります。少数の小さな値に引っ張られます。
問題では「正の大きな値」とあるため、分布は右に裾が長く伸びていると推測されます。
2. 尖度 (Kurtosis)
尖度は、確率分布やデータセットの尖り具合(ピークの鋭さ)や裾の重さ(外れ値の発生しやすさ)を示す指標です。正規分布の尖度は3です(これが基準となります)。
ソフトウェアによっては、正規分布の尖度が0になるように調整された「超過尖度」(尖度 - 3)が出力される場合もあるので注意が必要です。
- 尖度 = 3 (超過尖度 = 0):正規分布と同じ程度の尖り具合。
- 尖度 > 3 (超過尖度 > 0):正規分布よりも尖った(ピークが鋭く、裾が重い)分布。外れ値が発生しやすい傾向があります。「急尖的」とも言います。
- 尖度 < 3 (超過尖度 < 0):正規分布よりも平たい(ピークが丸く、裾が軽い)分布。外れ値が発生しにくい傾向があります。「緩尖的」とも言います。
問題では「3よりも大きな値」とあるため、分布は正規分布よりも尖っていると推測されます。
3. 結論の組み合わせ
歪度が正の大きな値であることから「右に裾が長く伸びている」。
尖度が3よりも大きな値であることから「正規分布よりも尖った分布である」。
これらを組み合わせると、「右に裾が長く伸び、正規分布よりも尖った分布である」と推測できます。
歪度と尖度の活用
歪度と尖度は、データが正規分布からどの程度ずれているかを評価するのに役立ちます。多くの統計手法(例:t検定、ANOVA)はデータの正規性を仮定しているため、これらの指標を確認することは重要です。ただし、これらの値だけで分布の形状を完全に判断することは難しく、ヒストグラムやQ-Qプロットなどと併せて視覚的に確認することが推奨されます。