クラスタリング可視化ツール
パラメータ
DBSCANとは?
説明:密度ベースのクラスタリングアルゴリズムで、指定した半径εの範囲内に最小点数(minPts)以上の点が存在する場合、それらを同一クラスタとみなします。密度の連続性に基づいてクラスタを拡張していきます。
特徴:クラスタ数を事前指定する必要がなく、任意の形状のクラスタを検出できます。ノイズや外れ値を自動的に識別し、密度の異なるクラスタも検出可能です。ただし、高次元データでは「次元の呪い」の影響を受けやすく、密度が大きく異なるクラスタが混在する場合はパラメータ設定が難しくなります。
隣接点
上記の式を満たす点 を、点 の隣接点とします。隣接点の数が 以上の場合、点 はクラスタに属します。クラスタに属する点の隣接点は、全て同じクラスタに属します。