中央値の意味
中央値は、データを小さい順に並べたとき中央に位置する値です。データ (1, 3, 9, 10, 20) はすでに昇順で、5個のデータの中央は3番目なので中央値は 9 です。正解は 9 です。 (選択肢2が正しい)
正解の理由
中央値は、データを小さい順に並べたとき中央に位置する値です。データ (1, 3, 9, 10, 20) はすでに昇順で、5個のデータの中央は3番目なので中央値は 9 です。正解は 9 です。
仕組み・頻出ポイント
- データ数が奇数なら中央の1つ、偶数なら中央2つの平均を中央値とします。
- 中央値は順位に基づくため、外れ値の影響を平均値より受けにくいです。
- 分布が歪んだデータでは、平均値より中央値の方が実態を表しやすい場合があります。
G検定で覚えるべきこと
平均値は全データの大きさを使い、中央値は並べた順序を使う点が違います。例えば最後の20が200に変わると平均値は大きく動きますが、中央値は9のままです。G検定では、データの中心を表す指標でも、平均・中央値・最頻値の頑健性や用途の違いを押さえることが重要です。
他の選択肢の評価
- 選択肢1: 3 は2番目の値で、5個の中央ではありません。
- 選択肢2: 正解です。昇順で3番目の値が中央値です。
- 選択肢3: 10 は4番目の値で、中央値ではありません。
- 選択肢4: 20 は最大値であり、中央値ではありません。
実務上の意味
統計の基本用語は、モデル評価やデータ前処理の判断にも直結します。数式だけでなく、値が大きいと何を意味するのか、どの前提で解釈できるのか、意思決定でどの誤りを避けるべきかを合わせて確認してください。
追加の確認観点
確認観点としては、中央値がデータの大きさではなく順位に基づく指標である点です。外れ値の影響を受けにくいため、所得、待ち時間、アクセス数のように歪みが大きいデータで有効です。G検定では、平均値より頑健だが、全データの大きさを細かく反映するわけではないと整理します。
結論として、この問題では「用語の定義」だけでなく、どの前提で使えるのか、どの誤解を避けるべきか、実務では何を確認するのかまで結びつけて理解することが重要です。