数学編

データサイエンスの基礎に必要な数学的素養

確率変数の分散と標準偏差 レベル1

確率変数 \(X\) の分散 Var(X) に関する記述として、最も適切なものを選択してください。

解説
解答と解説を表示
<h4>確率変数の分散 (Variance)</h4> <p>確率変数の分散 \(Var(X)\) または \(\sigma^2\) は、確率分布の重要な特性を示す指標の一つです。</p> <ul> <li><strong>意味:</strong> 分散は、確率変数 \(X\) の値がその<strong>期待値(平均値)\(E[X]\) からどれだけ散らばっているか</strong>、そのばらつきの度合いを定量的に示します。分散が大きいほど、データは平均値から広く分布していることを意味します。<strong>(選択肢2は正しい)</strong></li> <li><strong>定義:</strong> 分散は、期待値からの偏差 \((X - E[X])\) の二乗の期待値として定義されます:</p> <div class="formula"> $Var(X) = E[(X - E[X])^2]$ </div> <p>二乗することで、正負の偏差が打ち消し合うのを防ぎ、平均からの距離が大きい値の影響を強調します。計算を容易にするために、以下の式もよく使われます:</p> <div class="formula"> $Var(X) = E[X^2] - (E[X])^2$ </div></li> <li><strong>値の範囲:</strong> 分散は二乗の期待値であるため、常に0以上の値をとります (\(\text{Var}(X) \ge 0\))。分散が0になるのは、確率変数が定数(特定の値しかとらない)の場合のみです。期待値との大小関係は一般的には決まっていません。(選択肢3は誤り)</li> <li><strong>単位:</strong> 分散の計算では値を二乗するため、その単位は元の確率変数 \(X\) の単位の<strong>二乗</strong>になります(例: \(X\) が身長(cm)なら、分散の単位は cm²)。そのため、元の単位と合わせて解釈しやすいように、分散の正の平方根である<strong>標準偏差 (Standard Deviation, \(\sigma = \sqrt{Var(X)}\))</strong> がよく用いられます。標準偏差の単位は元の確率変数と同じです。(選択肢4は誤り)</li> <li><strong>最大値と最小値の差:</strong> これは範囲 (Range) と呼ばれる別の統計量であり、分散とは異なります。(選択肢1は誤り)</li> </ul> <p>したがって、分散に関する最も適切な記述は選択肢2です。</p> <div class="key-point"> <div class=\"key-point-title\">分散と標準偏差の使い分け</div> <ul> <li><strong>分散:</strong> 理論的な計算や数学的な性質(加法性など)を扱う際に便利。</li> <li><strong>標準偏差:</strong> データのばらつきを元の単位で解釈したい場合や、正規分布との関連(例: 68-95-99.7ルール)を考える際に便利。</li> </ul> </div>
問題 1/1
カテゴリ一覧に戻る