確率変数の分散 (Variance)
確率変数の分散 \(Var(X)\) または \(\sigma^2\) は、確率分布の重要な特性を示す指標の一つです。
- 意味: 分散は、確率変数 \(X\) の値がその期待値(平均値)\(E[X]\) からどれだけ散らばっているか、そのばらつきの度合いを定量的に示します。分散が大きいほど、データは平均値から広く分布していることを意味します。(選択肢2は正しい)
- 定義: 分散は、期待値からの偏差 \((X - E[X])\) の二乗の期待値として定義されます:
$Var(X) = E[(X - E[X])^2]$
二乗することで、正負の偏差が打ち消し合うのを防ぎ、平均からの距離が大きい値の影響を強調します。計算を容易にするために、以下の式もよく使われます:
$Var(X) = E[X^2] - (E[X])^2$
- 値の範囲: 分散は二乗の期待値であるため、常に0以上の値をとります (\(\text{Var}(X) \ge 0\))。分散が0になるのは、確率変数が定数(特定の値しかとらない)の場合のみです。期待値との大小関係は一般的には決まっていません。(選択肢3は誤り)
- 単位: 分散の計算では値を二乗するため、その単位は元の確率変数 \(X\) の単位の二乗になります(例: \(X\) が身長(cm)なら、分散の単位は cm²)。そのため、元の単位と合わせて解釈しやすいように、分散の正の平方根である標準偏差 (Standard Deviation, \(\sigma = \sqrt{Var(X)}\)) がよく用いられます。標準偏差の単位は元の確率変数と同じです。(選択肢4は誤り)
- 最大値と最小値の差: これは範囲 (Range) と呼ばれる別の統計量であり、分散とは異なります。(選択肢1は誤り)
したがって、分散に関する最も適切な記述は選択肢2です。
分散と標準偏差の使い分け
- 分散: 理論的な計算や数学的な性質(加法性など)を扱う際に便利。
- 標準偏差: データのばらつきを元の単位で解釈したい場合や、正規分布との関連(例: 68-95-99.7ルール)を考える際に便利。