主成分分析の固有値計算 - 多変量解析問題1

主成分分析の固有値計算レベル1

2次元データの共分散行列が $\mathbf{S} = \begin{pmatrix} 4 & 2 \\ 2 & 2 \end{pmatrix}$ で与えられている。第1主成分の分散（第1固有値）を求めよ。\n\n**注：** $\sqrt{5} = 2.236$ を使用すること。

解説

解答と解説を表示

<h4>主成分分析の固有値計算：共分散行列の分析</h4><div class='key-point'><div class='key-point-title'>主成分分析における固有値の意味</div><p>主成分分析では、データの分散を最大化する方向（主成分）を見つけます。各主成分の分散は共分散行列の固有値として得られ、これがデータの変動の大きさを表します。固有値が大きいほど、その方向でのデータの散らばりが大きいことを意味します。</p></div><h4>固有値の計算手順</h4><p class='step'><strong>Step 1: 特性方程式の設定</strong></p><p>与えられた共分散行列：</p><div class='formula'>$\mathbf{S} = \begin{pmatrix} 4 & 2 \\ 2 & 2 \end{pmatrix}

lt;/div><p>固有値$\lambda$を求めるため、特性方程式を立てます：</p><div class='formula'>$\det(\mathbf{S} - \lambda \mathbf{I}) = 0

lt;/div><div class='formula'>$\det\begin{pmatrix} 4-\lambda & 2 \\ 2 & 2-\lambda \end{pmatrix} = 0

lt;/div><p class='step'><strong>Step 2: 行列式の展開</strong></p><p>2×2行列の行列式を計算：</p><div class='formula'>$(4-\lambda)(2-\lambda) - 2 \cdot 2 = 0

lt;/div><div class='formula'>$(4-\lambda)(2-\lambda) - 4 = 0

lt;/div><div class='formula'>$8 - 4\lambda - 2\lambda + \lambda^2 - 4 = 0

lt;/div><div class='formula'>$\lambda^2 - 6\lambda + 4 = 0

lt;/div><p class='step'><strong>Step 3: 2次方程式の解</strong></p><p>解の公式を使用：</p><div class='formula'>$\lambda = \frac{6 \pm \sqrt{36 - 16}}{2} = \frac{6 \pm \sqrt{20}}{2}

lt;/div><div class='formula'>$\lambda = \frac{6 \pm 2\sqrt{5}}{2} = 3 \pm \sqrt{5}

lt;/div><p>したがって：</p><ul><li><strong>第1固有値</strong>：$\lambda_1 = 3 + \sqrt{5} \approx 3 + 2.236 = 5.236

lt;/li><li><strong>第2固有値</strong>：$\lambda_2 = 3 - \sqrt{5} \approx 3 - 2.236 = 0.764

lt;/li></ul><p class='step'><strong>Step 4: 結果の検証</strong></p><div class='key-point'><h4>固有値の性質確認</h4><ul><li><strong>非負性</strong>：$\lambda_1, \lambda_2 > 0$ ✓（共分散行列は半正定値）</li><li><strong>順序</strong>：$\lambda_1 > \lambda_2$ ✓</li><li><strong>トレース</strong>：$\lambda_1 + \lambda_2 = 5.236 + 0.764 = 6 = \text{tr}(\mathbf{S})$ ✓</li><li><strong>行列式</strong>：$\lambda_1 \times \lambda_2 = 5.236 \times 0.764 \approx 4 = \det(\mathbf{S})$ ✓</li></ul></div><p class='step'><strong>Step 5: 主成分分析への応用</strong></p><p><strong>第1主成分の寄与率：</strong></p><div class='formula'>$\text{寄与率}_1 = \frac{\lambda_1}{\lambda_1 + \lambda_2} = \frac{5.236}{6} \approx 87.3\%

lt;/div><p>これは第1主成分だけで全分散の87.3%を説明できることを意味します。</p><div class='key-point'><h4>実際の意味</h4><p>第1固有値 = 5.236 は、データを第1主成分方向に射影したときの分散の大きさです。元の2次元データの大部分の変動がこの1つの方向で捉えられるため、効果的な次元削減が可能であることを示しています。</p></div><h4>固有ベクトルとの関係</h4><p>第1固有値に対応する固有ベクトルが第1主成分の方向を示し、この方向でデータの分散が最大（5.236）になります。この手法により、高次元データの主要な変動パターンを特定できます。</p>