多変量解析

主成分分析、因子分析、判別分析、クラスター分析など統計検定準1級レベルの多変量統計手法を学習します。

クラスター分析の手法 レベル1

階層クラスター分析について、正しい記述はどれか。

解説
解答と解説を表示

階層クラスター分析:段階的グループ化の可視化

階層クラスター分析(Hierarchical Cluster Analysis)は、データを段階的にグループ化し、その過程を樹状図(デンドログラム)で可視化する教師なし学習手法です。

階層クラスター分析の特徴

  • 視覚的表現:クラスター形成過程を樹状図で表示
  • 柔軟な分割:任意のレベルでクラスター数を決定可能
  • 距離情報:クラスター間の距離が縦軸で表現
  • 階層構造:入れ子状のクラスター構造を表現

Step 1: 距離測定方法

観測値間の距離

  • ユークリッド距離:$d = \sqrt{\sum_{i=1}^p (x_i - y_i)^2}$
  • マンハッタン距離:$d = \sum_{i=1}^p |x_i - y_i|$
  • マハラノビス距離:共分散を考慮した距離
  • コサイン距離:角度に基づく類似度

Step 2: クラスター間距離(結合方法)

結合方法定義特徴
最短距離法最も近い点同士の距離鎖効果が起きやすい
最長距離法最も遠い点同士の距離コンパクトなクラスター
群平均法全点間距離の平均バランスの取れた結果
Ward法分散の増加を最小化等サイズクラスター傾向
重心法重心間の距離逆転現象の可能性

Step 3: 非階層クラスター分析との比較

項目階層クラスター分析非階層(k-means等)
クラスター数事後決定事前指定
計算量$O(n^3)$$O(nkt)$
結果の安定性決定論的初期値依存
大規模データ不向き適用可能
可視化デンドログラム散布図
問題 1/10
カテゴリ一覧に戻る