主成分分析、因子分析、判別分析、クラスター分析など統計検定準1級レベルの多変量統計手法を学習します。
階層クラスター分析について、正しい記述はどれか。
階層クラスター分析(Hierarchical Cluster Analysis)は、データを段階的にグループ化し、その過程を樹状図(デンドログラム)で可視化する教師なし学習手法です。
Step 1: 距離測定方法
Step 2: クラスター間距離(結合方法)
結合方法 | 定義 | 特徴 |
---|---|---|
最短距離法 | 最も近い点同士の距離 | 鎖効果が起きやすい |
最長距離法 | 最も遠い点同士の距離 | コンパクトなクラスター |
群平均法 | 全点間距離の平均 | バランスの取れた結果 |
Ward法 | 分散の増加を最小化 | 等サイズクラスター傾向 |
重心法 | 重心間の距離 | 逆転現象の可能性 |
Step 3: 非階層クラスター分析との比較
項目 | 階層クラスター分析 | 非階層(k-means等) |
---|---|---|
クラスター数 | 事後決定 | 事前指定 |
計算量 | $O(n^3)$ | $O(nkt)$ |
結果の安定性 | 決定論的 | 初期値依存 |
大規模データ | 不向き | 適用可能 |
可視化 | デンドログラム | 散布図 |