標準化得点の計算
標準化得点 $z$ は、値が平均から標準偏差何個分離れているかを表します。式は $z = (x - 平均) / 標準偏差$ です。今回、$x=70$、平均 50、標準偏差 10 なので、$z=(70-50)/10=2$ です。正解は 2 です。 (選択肢3が正しい)
正解の理由
標準化得点 $z$ は、値が平均から標準偏差何個分離れているかを表します。式は $z = (x - 平均) / 標準偏差$ です。今回、$x=70$、平均 50、標準偏差 10 なので、$z=(70-50)/10=2$ です。正解は 2 です。
仕組み・頻出ポイント
- zが正なら平均より上、負なら平均より下にあることを表します。
- 異なる単位や尺度の特徴量を比較しやすくするため、機械学習の前処理でも標準化が使われます。
- 標準正規分布と組み合わせると、平均からの離れ具合を確率的に解釈できます。
G検定で覚えるべきこと
標準化では「平均との差」を「標準偏差」で割ります。平均を引き忘れて70/10=7としたり、標準偏差を掛けたりするのは誤りです。実務では、スケールの大きい特徴量が学習を支配しないようにするためにも重要です。G検定では、計算問題としても、前処理の意味としても出題されます。
他の選択肢の評価
- 選択肢1: 0.5 は平均との差20を標準偏差10で割った値ではありません。
- 選択肢2: 1 は平均との差を10と誤った場合などに出る値です。
- 選択肢3: 正解です。平均から20離れており、標準偏差2個分です。
- 選択肢4: 20 は平均との差であり、標準化後の値ではありません。
実務上の意味
統計の基本用語は、モデル評価やデータ前処理の判断にも直結します。数式だけでなく、値が大きいと何を意味するのか、どの前提で解釈できるのか、意思決定でどの誤りを避けるべきかを合わせて確認してください。
追加の確認観点
確認観点としては、標準化によって異なる単位の値を同じ物差しで比較できる点です。機械学習では、スケールの大きい特徴量が学習に過度な影響を与えないようにする前処理として重要です。ただし、木系モデルなど標準化の必要性が小さい手法もあり、手法との関係も意識します。
結論として、この問題では「用語の定義」だけでなく、どの前提で使えるのか、どの誤解を避けるべきか、実務では何を確認するのかまで結びつけて理解することが重要です。