集合の濃度(Cardinality)は集合の「大きさ」を表す概念です。データサイエンスでは、データセットのサイズ、特徴量の数、クラスの数など、多くの場面で重要になります。
集合の濃度の定義
有限集合 $A$ の濃度は、$A$ に含まれる要素の個数で、$|A|$ または $\#A$ で表記されます。
1. 集合 $S$ の要素を列挙
$S = \{x \in \mathbb{Z} : |x| \leq 3\}$ は、絶対値が3以下の整数の集合です。
絶対値の条件 $|x| \leq 3$ を満たす整数は:
$-3 \leq x \leq 3$
この範囲の整数を列挙すると:
$S = \{-3, -2, -1, 0, 1, 2, 3\}$
2. 濃度の計算
集合 $S$ の要素を数えると:
$S = \{-3, -2, -1, 0, 1, 2, 3\}$ には7個の要素があります。
したがって、$|S| = 7$ です。
濃度計算の応用
集合の濃度は以下の場面で重要です:
- 確率論:標本空間のサイズと確率計算
- 統計学:データセットのサイズとサンプルサイズ
- 機械学習:特徴量の数とモデルの複雑度
- データベース:テーブルのレコード数とインデックス設計