教師あり学習を見分ける観点
教師あり学習は、入力データと正解ラベルの組を使い、未知データに対する予測規則を学習する方法です。G検定では、教師あり学習・教師なし学習・強化学習の区別が頻出です。分類なら「犬/猫」「スパム/非スパム」のようなカテゴリ、回帰なら「価格」「需要量」のような連続値を、過去の正解付きデータから予測します。
正解の理由
選択肢1は、入力と正解ラベルの対応から予測モデルを作ると述べており、教師あり学習の定義そのものです。学習時に正解が与えられ、推論時には未知の入力に対してラベルや数値を出す、という流れを押さえてください。
他の選択肢の評価
- 選択肢2は教師なし学習です。正解ラベルを使わず、クラスタリングや次元削減でデータ構造を探します。
- 選択肢3は強化学習です。エージェント、環境、行動、報酬、方策という語と結びつけます。
- 選択肢4はルールベースの説明です。人間が明示した規則で判断するため、データから規則を学ぶ機械学習とは異なります。
覚えるべきポイント
- 正解ラベルあり: 教師あり学習。
- 正解ラベルなし: 教師なし学習。
- 行動と報酬: 強化学習。
実務では、まず目的変数が明確に定義できるかを確認します。目的変数があれば教師あり学習を検討し、なければクラスタリングや探索的分析から始める、という判断になります。
試験対策の確認
この論点では、用語の暗記だけでなく「どの入力を使い、何を予測し、どの指標で評価するか」を対応づけることが重要です。実務では、データ分割、前処理、評価指標の選択を誤ると、訓練時に良く見えるモデルでも本番で役に立たないことがあります。選択肢を読むときは、教師あり・教師なし・強化学習、分類・回帰、前処理・評価・モデル構造のどの話かを切り分けて判断しましょう。
追加の確認観点
選択肢を解くときは、まず問題が「学習方法」「タスク種別」「評価指標」「前処理」「モデルの性質」のどれを問うているかを分けてください。機械学習では、同じ用語でも目的変数の有無、正解ラベルの有無、データ分割の方法によって意味が変わります。実務では、モデルを選ぶ前に、予測したい値、利用できる特徴量、誤判定のコスト、説明責任の必要性を整理します。G検定では、名称を覚えるだけでなく、どの場面で使い、どの失敗を避けるための考え方かまで結びつけると安定して判断できます。