特徴量ベクトルの次元
特徴量ベクトルの次元とは、1つのデータを表すために使う特徴量の個数です。問題では [身長, 体重, 年齢, 睡眠時間] という4つの値で1人または1件のデータを表しているため、入力ベクトルは4次元です。G検定では、ベクトル、行列、テンソルの形状を読み取る力が、ニューラルネットワークや機械学習の理解の土台になります。
正解の理由
選択肢3の4次元が正解です。ベクトルの次元は、データ件数ではなく、1件あたりに並んでいる成分の数で決まります。この例では成分が「身長」「体重」「年齢」「睡眠時間」の4つなので4次元です。100人分のデータがあっても、1人あたりの特徴量が4個なら、各データの特徴量ベクトルは4次元です。
G検定で押さえるポイント
- 1件のデータを横に見たとき、特徴量がいくつあるかがベクトルの次元です。
- 複数件のデータをまとめると、一般に「データ件数 × 特徴量数」の行列として表します。
- 画像では高さ、幅、チャネル数を持つため、ベクトルより高次のテンソルとして扱うことがあります。
混同しやすい論点
- データ件数と特徴量数を混同しないことが重要です。100件のデータがあっても、特徴量が4個なら各ベクトルは4次元です。
- 1次元という表現は「成分が1個」の意味でも使われますが、この問題では成分が4個あります。
- モデル入力の次元は、前処理で特徴量を追加・削除すると変わります。
他の選択肢の評価
- 選択肢1は成分が1個の場合の説明で、この問題には当てはまりません。
- 選択肢2は成分が2個の場合です。
- 選択肢3が正解です。4つの特徴量があるため4次元です。
- 選択肢4は誤りです。データ件数とは独立に、1件あたりの特徴量数で次元を決めます。
実務上の意味
実務では、特徴量の数が増えるとモデルの表現力が上がる一方、過学習や計算量増加のリスクも高まります。データ行列の形を正しく理解していないと、学習ライブラリに渡す配列の向きや次元を間違え、エラーや誤った学習につながります。
G検定では、用語の丸暗記だけでなく「どの場面で使う概念か」「何と対比されるか」まで問われやすいです。正答を選んだ後に、誤答がなぜ成り立たないかを説明できる状態にしておくと、文章表現を変えた問題にも対応しやすくなります。G検定対策では、正解語だけでなく、反対概念、代表例、限界、現在の実務での使われ方を一緒に説明できる粒度まで確認しておくと安定します。また、問題文の時代背景や技術名を手がかりに、どのAIブーム・どの学習方式・どの限界の話かを切り分けてください。