分類と回帰の違い
分類と回帰は、教師あり学習の代表的なタスクです。どちらも入力と正解の組から予測モデルを作りますが、予測したい出力の性質が異なります。分類は「どのクラスに属するか」というカテゴリを予測し、回帰は価格、需要、温度、売上のような連続的な数値を予測します。G検定では、問題設定を読んで分類か回帰かを判断する問題がよく出ます。
正解の理由
選択肢2の分類はカテゴリを予測し、回帰は連続値を予測するという説明が正しいです。たとえば、画像が犬か猫かを判定するのは分類、住宅の面積や駅距離から価格を予測するのは回帰です。出力の形式が違うため、よく使う損失関数や評価指標も変わります。
G検定で押さえるポイント
- 分類の出力はクラスラベルまたはクラス確率です。二値分類と多クラス分類を区別して覚えます。
- 回帰の出力は連続値です。平均二乗誤差、平均絶対誤差、決定係数などが評価に使われます。
- 分類ではAccuracy、Precision、Recall、F値、AUCなど、クラス不均衡を意識した指標が重要です。
混同しやすい論点
- 数値を扱うから回帰とは限りません。数字で表されたカテゴリ、たとえば郵便番号や商品IDを予測する場合は分類に近い扱いです。
- 確率値を出す分類モデルもありますが、最終的な目的がクラス選択なら分類です。
- 教師なし学習や強化学習は、分類・回帰とは別の学習枠組みとして整理します。
他の選択肢の評価
- 選択肢1は分類と回帰が逆です。分類はカテゴリ、回帰は連続値です。
- 選択肢2が正解です。出力の型に着目した最も基本的な区別です。
- 選択肢3は誤りです。分類も回帰も主に教師あり学習で扱われます。
- 選択肢4は誤りです。分類と回帰は正解ラベルや目的変数を使って学習するのが基本です。
実務上の意味
実務では、目的変数をどう定義するかでタスクが変わります。顧客が解約するかを予測するなら分類、解約確率そのものをスコアとして扱うなら分類モデルの確率出力を活用します。来月の売上金額を予測するなら回帰です。タスク定義を誤ると、評価指標や改善方針もずれてしまいます。
G検定では、用語の丸暗記だけでなく「どの場面で使う概念か」「何と対比されるか」まで問われやすいです。正答を選んだ後に、誤答がなぜ成り立たないかを説明できる状態にしておくと、文章表現を変えた問題にも対応しやすくなります。G検定対策では、正解語だけでなく、反対概念、代表例、限界、現在の実務での使われ方を一緒に説明できる粒度まで確認しておくと安定します。また、問題文の時代背景や技術名を手がかりに、どのAIブーム・どの学習方式・どの限界の話かを切り分けてください。