中央値の特徴
中央値は、データを小さい順または大きい順に並べたとき中央に位置する値です。平均値と同じく代表値の一つですが、極端に大きい値や小さい値、つまり外れ値の影響を受けにくいという特徴があります。G検定では、平均値、中央値、最頻値の違いを、データ分布の見方と合わせて押さえることが大切です。
正解の理由
選択肢1のデータを小さい順に並べたとき中央に位置する値が正解です。データ数が奇数なら中央の1つの値、偶数なら中央の2つの値の平均を中央値とするのが一般的です。たとえば 1, 2, 100 の平均は34.3ですが、中央値は2であり、外れ値の影響を受けにくいことが分かります。
G検定で押さえるポイント
- 中央値は、順序情報に基づく代表値です。
- 外れ値がある分布や歪んだ分布では、平均値より中央値の方が実態を表しやすい場合があります。
- 所得、住宅価格、購買金額など、右に長い分布では中央値がよく使われます。
混同しやすい論点
- 最大値と最小値の差は範囲であり、中央値ではありません。
- すべて足した値は合計であり、平均値ですらありません。平均値は合計を個数で割ります。
- 対称な分布では平均値と中央値が近くなることがありますが、必ず同じではありません。
他の選択肢の評価
- 選択肢1が正解です。並べたときの中央の値が中央値です。
- 選択肢2は範囲の説明です。
- 選択肢3は合計の説明です。
- 選択肢4は誤りです。中央値と平均値は一致する場合もありますが、常に同じではありません。
実務上の意味
実務では、平均値だけで意思決定すると外れ値に引っ張られた判断になり得ます。ユーザーの利用時間、購買金額、応答時間などは分布が歪みやすいため、中央値や分位点も併せて見ると、典型的なユーザー体験を把握しやすくなります。
G検定では、用語の丸暗記だけでなく「どの場面で使う概念か」「何と対比されるか」まで問われやすいです。正答を選んだ後に、誤答がなぜ成り立たないかを説明できる状態にしておくと、文章表現を変えた問題にも対応しやすくなります。G検定対策では、正解語だけでなく、反対概念、代表例、限界、現在の実務での使われ方を一緒に説明できる粒度まで確認しておくと安定します。また、問題文の時代背景や技術名を手がかりに、どのAIブーム・どの学習方式・どの限界の話かを切り分けてください。