この問題では、定常分布の理論と計算手法の数学的基盤について理解を深めます。
定常分布理論:確率システムの平衡状態の数学
定常分布(stationary distribution)は、マルコフ連鎖が無限時間後に収束する確率分布で、システムの「平衡状態」を数学的に記述します。この分布は左固有ベクトルとしての線形代数的性質と、測度論的な確率論的性質を併せ持つ深い数学的対象です。
Step 1: 遷移確率行列の詳細解析
与えられた遷移確率行列:
$P = \begin{pmatrix} 0.6 & 0.4 \\ 0.3 & 0.7 \end{pmatrix}$
行列の基本的性質:
- 確率行列:各行の和が1
- 既約性:すべての要素が正なので既約
- 非周期性:対角要素が正なので非周期
- 双確率行列ではない:列和が1ではない
2×2遷移行列の分類
| 要素 | 値 | 解釈 |
|---|
| $P_{11} = 0.6$ | 状態1での残留確率 | 慣性・持続性の測度 |
| $P_{12} = 0.4$ | 状態1→2の遷移確率 | 状態変更の傾向 |
| $P_{21} = 0.3$ | 状態2→1の遷移確率 | 逆向き変更の確率 |
| $P_{22} = 0.7$ | 状態2での残留確率 | 状態2の安定性 |
Step 2: 定常分布の数学的定義と存在理論
定常分布の厳密な定義:
確率ベクトル$\pi = (\pi_1, \pi_2)$が定常分布であるとは、以下の条件を満たすことです:
$\pi P = \pi \quad \text{(平衡条件)}$
$\sum_{i=1}^2 \pi_i = 1 \quad \text{(正規化条件)}$
$\pi_i \geq 0 \quad \text{(非負条件)}$
線形代数的解釈:
定常分布は、転置行列$P^T$の固有値1に対応する左固有ベクトルです:
$\pi P = \pi \Leftrightarrow \pi(P - I) = \mathbf{0} \Leftrightarrow P^T \pi^T = \pi^T$
定常分布の存在と一意性定理
既約有限マルコフ連鎖に対して:
- 存在性:Perron-Frobenius定理により固有値1が存在
- 一意性:既約性により固有空間の次元が1
- 正値性:既約性によりすべての成分が正
- 収束性:非周期性により任意の初期分布から収束
Step 3: 平衡方程式の詳細な導出
行列方程式の展開:
$\begin{pmatrix} \pi_1 & \pi_2 \end{pmatrix} \begin{pmatrix} 0.6 & 0.4 \\ 0.3 & 0.7 \end{pmatrix} = \begin{pmatrix} \pi_1 & \pi_2 \end{pmatrix}$
成分ごとの等式:
\begin{align}\pi_1 \cdot 0.6 + \pi_2 \cdot 0.3 &= \pi_1 \quad \text{(第1成分)} \\\pi_1 \cdot 0.4 + \pi_2 \cdot 0.7 &= \pi_2 \quad \text{(第2成分)}\end{align}
方程式の簡約:
\begin{align}0.6\pi_1 + 0.3\pi_2 &= \pi_1 \\0.4\pi_1 + 0.7\pi_2 &= \pi_2\end{align}
\begin{align}-0.4\pi_1 + 0.3\pi_2 &= 0 \quad \text{(式1)} \\0.4\pi_1 - 0.3\pi_2 &= 0 \quad \text{(式2)}\end{align}
方程式の独立性:
式1と式2は実質的に同一であり、系は1次元の解空間を持ちます。これは既約2状態マルコフ連鎖の一般的性質です。
Step 4: 複数の解法アプローチ
方法1:連立方程式による解法
式1から:
$0.3\pi_2 = 0.4\pi_1 \Rightarrow \pi_2 = \frac{4}{3}\pi_1$
正規化条件$\pi_1 + \pi_2 = 1$に代入:
$\pi_1 + \frac{4}{3}\pi_1 = 1 \Rightarrow \frac{7}{3}\pi_1 = 1 \Rightarrow \pi_1 = \frac{3}{7}$
$\pi_2 = 1 - \pi_1 = 1 - \frac{3}{7} = \frac{4}{7}$
方法2:詳細釣り合い原理(この行列では適用不可)
詳細釣り合い条件:$\pi_i P_{ij} = \pi_j P_{ji}$
検証:$\frac{3}{7} \times 0.4 = \frac{12}{70}$, $\frac{4}{7} \times 0.3 = \frac{12}{70}$
偶然にも詳細釣り合いが成立しており、この連鎖は可逆です。
方法3:固有ベクトル法
特性方程式:$\det(P^T - I) = 0$
$\det\begin{pmatrix} -0.4 & 0.3 \\ 0.4 & -0.3 \end{pmatrix} = (-0.4)(-0.3) - (0.3)(0.4) = 0.12 - 0.12 = 0$
これは固有値1の存在を確認します。
Step 5: 数値計算と精度検証
正確な分数表現:
$\pi_1 = \frac{3}{7}, \quad \pi_2 = \frac{4}{7}$
小数近似:
$\pi_1 = \frac{3}{7} = 0.428571\ldots \approx 0.429$
$\pi_2 = \frac{4}{7} = 0.571428\ldots \approx 0.571$
検証計算:
$\pi P = \begin{pmatrix} \frac{3}{7} & \frac{4}{7} \end{pmatrix} \begin{pmatrix} 0.6 & 0.4 \\ 0.3 & 0.7 \end{pmatrix}$
$= \begin{pmatrix} \frac{3}{7} \times 0.6 + \frac{4}{7} \times 0.3 & \frac{3}{7} \times 0.4 + \frac{4}{7} \times 0.7 \end{pmatrix}$
$= \begin{pmatrix} \frac{1.8 + 1.2}{7} & \frac{1.2 + 2.8}{7} \end{pmatrix} = \begin{pmatrix} \frac{3}{7} & \frac{4}{7} \end{pmatrix} = \pi \,\checkmark$
定常分布の物理的解釈
| 状態 | 定常確率 | 意味 |
|---|
| 状態1 | $\pi_1 = \frac{3}{7} \approx 42.9\%$ | 長期的に約43%の時間滞在 |
| 状態2 | $\pi_2 = \frac{4}{7} \approx 57.1\%$ | 長期的に約57%の時間滞在 |
Step 6: 高次遷移確率と収束解析
固有値分解による対角化:
固有値:$\lambda_1 = 1$, $\lambda_2 = 0.3$
対応する固有ベクトル:
- $\mathbf{v}_1 = \begin{pmatrix} 3 \\ 4 \end{pmatrix}$(固有値1)
- $\mathbf{v}_2 = \begin{pmatrix} 1 \\ -1 \end{pmatrix}$(固有値0.3)
$n$ステップ遷移確率:
$P^n = \begin{pmatrix} \frac{3}{7} & \frac{4}{7} \\ \frac{3}{7} & \frac{4}{7} \end{pmatrix} + 0.3^n \begin{pmatrix} \frac{4}{7} & -\frac{4}{7} \\ -\frac{3}{7} & \frac{3}{7} \end{pmatrix}$
収束速度:
指数減衰率$0.3^n$により、約$\frac{\ln(0.01)}{\ln(0.3)} \approx 3.8$ステップで99%の精度で定常分布に収束します。
Step 7: エルゴード理論との関連
エルゴード定理の適用:
既約・非周期マルコフ連鎖に対して:
$\lim_{n \to \infty} \frac{1}{n} \sum_{k=0}^{n-1} \mathbf{1}_{\{X_k = i\}} = \pi_i \quad \text{a.s.}$
これは「時間平均=空間平均」を意味し、状態$i$での滞在時間割合が定常確率に収束することを保証します。
強法則大数と中心極限定理:
- SLLN:時間平均の概収束
- CLT:正規化された偏差の分布収束
- LIL:反復対数の法則による振動の評価
Step 8: 可逆性と詳細釣り合い
可逆性の検証:
詳細釣り合い条件:$\pi_i P_{ij} = \pi_j P_{ji}$
$\pi_1 P_{12} = \frac{3}{7} \times 0.4 = \frac{12}{70}$
$\pi_2 P_{21} = \frac{4}{7} \times 0.3 = \frac{12}{70}$
等しいので、この連鎖は可逆(reversible)です。
可逆性の意味:
- 時間反転不変性:前向きと後向きの過程が同分布
- 対称化可能性:適当な重みで対称行列に変換可能
- スペクトル性質:すべての固有値が実数
Step 9: 数値的安定性と計算手法
反復法による数値解:
べき乗法:$\pi^{(n+1)} = \pi^{(n)} P$
初期値$\pi^{(0)} = (0.5, 0.5)$から開始:
- $\pi^{(1)} = (0.45, 0.55)$
- $\pi^{(2)} = (0.435, 0.565)$
- $\pi^{(3)} = (0.4305, 0.5695)$
- $\vdots$
- $\pi^{(\infty)} = (\frac{3}{7}, \frac{4}{7})$
収束判定:
$\|\pi^{(n+1)} - \pi^{(n)}\| < \epsilon$で収束判定を行います。
Step 10: 一般理論への拡張
$n$状態マルコフ連鎖:
一般の$n \times n$行列$P$に対して:
$(P^T - I)\pi^T = \mathbf{0}, \quad \mathbf{1}^T \pi^T = 1$
これは$(n-1)$個の独立な線形方程式と1個の正規化条件からなる連立方程式です。
特異値分解(SVD)による解法:
$P^T - I$の零空間を求める問題として、数値線形代数の手法が適用できます。
Step 11: 摂動理論と感度解析
遷移確率の摂動:
$P(\epsilon) = P + \epsilon \Delta P$に対する定常分布の変化:
$\pi(\epsilon) = \pi + \epsilon \Delta \pi + O(\epsilon^2)$
感度行列:
$\frac{\partial \pi_i}{\partial P_{jk}}$により、各遷移確率が定常分布に与える影響を定量化できます。
Step 12: 統計的推論
最尤推定:
観測データから遷移確率を推定し、その定常分布を計算:
$\hat{P}_{ij} = \frac{N_{ij}}{\sum_k N_{ik}}$
ここで$N_{ij}$は状態$i$から$j$への観測遷移回数です。
信頼区間:
デルタ法により、定常確率の漸近分布を導出し、信頼区間を構築できます。
おまけ:
定常分布の理論は、線形代数の固有値問題、測度論的確率論、エルゴード理論が見事に統合された数学の傑作です。単純な「平衡方程式」の背後には、Perron-Frobenius理論の深い構造があり、既約性・非周期性という組み合わせ的性質が解析的性質(一意性・正値性・収束性)を保証する美しい対応関係があります。また、詳細釣り合い条件による可逆性は、確率過程の「時間対称性」を表現し、物理学の平衡統計力学との深い関連を示します。この理論により、複雑な確率システムの長期挙動が、有限次元線形代数の問題に帰着される点が、おもしろいです。