データの要約と分析の基礎を確認します。
あるテストの平均点が70点、標準偏差が10点である。85点を取った学生のZ得点を求めよ。
この問題では、標準化(Standardization)とZ得点(Z-score)について深く理解します。これらは統計学の基礎概念であり、データの比較・分析、統計的検定、機械学習において極めて重要な役割を果たします。
標準化とは、異なる単位や尺度で測定されたデータを、共通の基準で比較可能にする統計的変換技法です。この変換により、データは平均0、標準偏差1の標準正規分布に従うようになります。
Step 1: 標準化が必要な理由
Step 2: Z得点の数学的定義
Z得点(標準得点)は、個々のデータ点が平均からどれだけ標準偏差単位で離れているかを示す無次元量です:
ここで:
Step 3: 具体的な計算プロセス
与えられた情報:
Z得点の計算:
$Z = 1.5$という結果は、この学生の得点が平均を1.5標準偏差上回っていることを意味します。
Z得点の範囲 | 解釈 | 今回の例 |
---|---|---|
Z > 2 | 非常に高い(上位2.5%) | 該当せず |
1 < Z ≤ 2 | 高い(上位16%~2.5%) | ✓ Z = 1.5 |
-1 ≤ Z ≤ 1 | 標準的な範囲(68%) | 該当せず |
Step 4: 68-95-99.7ルール(経験則)の応用
標準正規分布において、以下の経験則が成り立ちます:
Step 5: 85点の相対的位置の詳細分析
$Z = 1.5$の学生の相対的位置を標準正規分布表から求めると:
別の具体例で標準化の効果を確認:
元のデータセット:
標準化後の比較:
両科目で同じZ得点となり、相対的な成績が同等であることが判明します。
Step 9: 標準化の前提条件と限界
前提条件:
Step 10: 標本データでの実装
実際の分析では、母集団パラメータが未知のため、標本統計量を使用:
ここで、$\\bar{x}$は標本平均、$s$は標本標準偏差です。