確率と確率分布

事象と確率、確率分布の特性値、変数変換、大数の法則、中心極限定理など統計検定準1級レベルの確率論を学習します。

多変量正規分布の性質 レベル1

2次元正規分布$(X,Y) \sim N\left(\begin{pmatrix}0\\0\end{pmatrix}, \begin{pmatrix}4 & 2\\2 & 9\end{pmatrix}\right)$において、$X$と$Y$の相関係数はいくらか。

解説
解答と解説を表示
<p>この問題では、<strong>多変量正規分布の共分散構造</strong>について理解を深めます。多変量正規分布は統計学における分布の一つで、幅広い分野で基礎となる概念です。</p><h4>多変量正規分布:高次元確率モデルの基礎</h4><p>多変量正規分布は、ガウスによって体系化され、高次元データ解析の理論的基盤となっています。単変量正規分布の自然な拡張として、複数の確率変数間の線形関係を記述する基本的なモデルです。</p><p class='step'><strong>Step 1: 多変量正規分布の数学的定義</strong></p><p>$k$次元多変量正規分布$N(\boldsymbol{\mu}, \Sigma)$は以下で定義されます:</p><div class='formula'>$f(\mathbf{x}) = \frac{1}{(2\pi)^{k/2}|\Sigma|^{1/2}} \exp\left(-\frac{1}{2}(\mathbf{x} - \boldsymbol{\mu})^T \Sigma^{-1} (\mathbf{x} - \boldsymbol{\mu})\right)$

ここで:

  • $\boldsymbol{\mu} \in \mathbb{R}^k$:平均ベクトル
  • $\Sigma \in \mathbb{R}^{k \times k}$:共分散行列(正定値対称行列)
  • $|\Sigma|$:共分散行列の行列式
共分散行列

共分散行列$\Sigma$は分布の形状を完全に決定します:

  • 対角成分:各変数の分散(ばらつきの大きさ)
  • 非対角成分:変数間の共分散(線形関係の強さ)
  • 固有値:主軸方向の分散の大きさ
  • 固有ベクトル:分布の主軸方向

Step 2: 相関係数の理論的基礎

相関係数(ピアソンの積率相関係数)は、線形関係の強さを測る基本的指標です:

$\rho_{XY} = \frac{\text{Cov}(X,Y)}{\sqrt{\text{Var}(X)} \sqrt{\text{Var}(Y)}} = \frac{\sigma_{XY}}{\sigma_X \sigma_Y}$

相関係数の性質:

  • 標準化:$-1 \leq \rho_{XY} \leq 1$
  • 対称性:$\rho_{XY} = \rho_{YX}$
  • 単位不変性:変数のスケール変換に不変
  • 線形変換:線形関係のみを捉える

Step 3: 共分散行列の詳細解析

与えられた共分散行列:

$\Sigma = \begin{pmatrix}4 & 2\\2 & 9\end{pmatrix}$

行列要素の解釈:

共分散行列の読み方
位置意味
$\Sigma_{11}$$\text{Var}(X) = 4$$X$の分散
$\Sigma_{22}$$\text{Var}(Y) = 9$$Y$の分散
$\Sigma_{12} = \Sigma_{21}$$\text{Cov}(X,Y) = 2$$X$と$Y$の共分散

Step 4: 標準偏差の計算

各変数の標準偏差:

\begin{align}\sigma_X &= \sqrt{\text{Var}(X)} = \sqrt{4} = 2 \\\sigma_Y &= \sqrt{\text{Var}(Y)} = \sqrt{9} = 3\end{align}

Step 5: 相関係数の詳細計算

\begin{align}\rho_{XY} &= \frac{\text{Cov}(X,Y)}{\sigma_X \sigma_Y} \\&= \frac{2}{2 \times 3} \\&= \frac{2}{6} \\&= \frac{1}{3} \approx 0.333\end{align}

結果の解釈と意味

Step 6: 相関係数の統計的解釈

$\rho_{XY} = \frac{1}{3} \approx 0.333$は:

  • 正の相関:$X$が増加すると$Y$も増加する傾向
  • 中程度の強さ:完全な線形関係ではないが、明確な関係性
  • 決定係数:$\rho^2 = \frac{1}{9} \approx 0.111$(約11%の分散を説明)
相関の強さの目安
相関係数の範囲関係の強さ今回の値
$|\rho| < 0.3$弱い相関-
$0.3 \leq |\rho| < 0.7$中程度の相関$\rho = 0.333$ ✓
$|\rho| \geq 0.7$強い相関-

多変量正規分布の幾何学的性質

Step 7: 分布の形状分析

共分散行列の固有値と固有ベクトルを求めて分布の形状を理解:

固有値方程式:

$\det(\Sigma - \lambda I) = \det\begin{pmatrix}4-\lambda & 2\\2 & 9-\lambda\end{pmatrix} = (4-\lambda)(9-\lambda) - 4 = 0$
$\lambda^2 - 13\lambda + 32 = 0$

固有値:

$\lambda_1 = \frac{13 + \sqrt{169-128}}{2} = \frac{13 + \sqrt{41}}{2} \approx 9.70$
$\lambda_2 = \frac{13 - \sqrt{41}}{2} \approx 3.30$

これにより、分布の楕円形状が決定されます。

性質:

多変量正規分布において:

  • 周辺分布:各変数は正規分布に従う
  • 条件付き分布:条件付き分布も正規分布
  • 独立性:$\rho_{XY} = 0 \Leftrightarrow X \perp Y$(正規分布の場合のみ)
  • 線形結合:任意の線形結合も正規分布

深い洞察:
相関係数$\frac{1}{3}$は、$X$と$Y$が中程度の正の線形関係を持つことを示します。多変量正規分布では、この相関構造が分布の楕円形状を決定し、条件付き分布や線形予測の精度に直接影響します。現実の多次元データ分析では、このような相関構造の理解が、適切なモデル選択と解釈の鍵となります。</p>

問題 1/10
カテゴリ一覧に戻る