クラスタリング可視化ツール

パラメータ

DBSCANとは?

説明:密度ベースのクラスタリングアルゴリズムで、指定した半径εの範囲内に最小点数(minPts)以上の点が存在する場合、それらを同一クラスタとみなします。密度の連続性に基づいてクラスタを拡張していきます。
特徴:クラスタ数を事前指定する必要がなく、任意の形状のクラスタを検出できます。ノイズや外れ値を自動的に識別し、密度の異なるクラスタも検出可能です。ただし、高次元データでは「次元の呪い」の影響を受けやすく、密度が大きく異なるクラスタが混在する場合はパラメータ設定が難しくなります。

隣接点

xixj<ϵ
上記の式を満たす点xjを、点xiの隣接点とします。隣接点の数がminPts以上の場合、点xiはクラスタに属します。クラスタに属する点の隣接点は、全て同じクラスタに属します。

学習の過程