状態空間モデル:現代時系列解析の統一フレームワーク
状態空間モデルの革新性
状態空間モデル(State Space Model)は、Kalman(1960)によって開発された画期的なフレームワークで、観測されない潜在状態の動学と観測データの関係を同時にモデル化します。制御工学から始まり、経済学、ファイナンス、生物統計学、機械学習まで幅広い分野で中核的な役割を果たしています。ARIMA、回帰、構造時系列モデルなど多様なモデルを統一的に表現でき、missing dataや不規則観測にも対応可能な柔軟なフレームワークです。
状態空間モデルの基本構造
Step 1: 2つの基本方程式
状態空間モデルの定義
観測方程式(Observation/Measurement Equation):
$\mathbf{y}_t = \mathbf{H}_t \boldsymbol{\alpha}_t + \boldsymbol{\epsilon}_t, \quad \boldsymbol{\epsilon}_t \sim \mathcal{N}(\mathbf{0}, \mathbf{R}_t)$
状態方程式(State/Transition Equation):
$\boldsymbol{\alpha}_t = \mathbf{F}_t \boldsymbol{\alpha}_{t-1} + \boldsymbol{\eta}_t, \quad \boldsymbol{\eta}_t \sim \mathcal{N}(\mathbf{0}, \mathbf{Q}_t)$
ここで:
- $\mathbf{y}_t$:観測ベクトル($p \times 1$)
- $\boldsymbol{\alpha}_t$:状態ベクトル($m \times 1$)
- $\mathbf{H}_t$:観測行列($p \times m$)
- $\mathbf{F}_t$:状態遷移行列($m \times m$)
- $\mathbf{R}_t$:観測誤差分散行列($p \times p$)
- $\mathbf{Q}_t$:状態誤差分散行列($m \times m$)
線形ガウシアン状態空間モデル(LGSSM)
Step 2: 古典的LGSSMの特徴
基本仮定:
- 線形性:すべての関係が線形
- ガウス性:すべての誤差項が正規分布
- 独立性:$E[\boldsymbol{\epsilon}_t \boldsymbol{\eta}_s^T] = \mathbf{0}$ for all $t, s$
- 初期条件:$\boldsymbol{\alpha}_0 \sim \mathcal{N}(\boldsymbol{\mu}_0, \mathbf{P}_0)$
LGSSM の利点:
- カルマンフィルタによる最適フィルタリング
- 解析的な予測・平滑化
- 尤度の効率的計算
- 理論的性質の明確性
LGSSMの最適性
線形ガウシアン仮定下では、カルマンフィルタは以下の意味で最適です:
- 平均二乗誤差最小:$E[\|\boldsymbol{\alpha}_t - \hat{\boldsymbol{\alpha}}_{t|t}\|^2]$を最小化
- 最尤推定:観測データの尤度を最大化
- ベイズ最適:事後分布を正確に計算
- 線形最小分散不偏推定(BLUE)
非線形・非ガウシアン拡張
Step 3: モデルの一般化
1. 非線形状態空間モデル:
$\mathbf{y}_t = \mathbf{h}(\boldsymbol{\alpha}_t, \mathbf{u}_t) + \boldsymbol{\epsilon}_t$
$\boldsymbol{\alpha}_t = \mathbf{f}(\boldsymbol{\alpha}_{t-1}, \mathbf{v}_t) + \boldsymbol{\eta}_t$
ここで、$\mathbf{h}(\cdot)$、$\mathbf{f}(\cdot)$は非線形関数
2. 非ガウシアン分布:
- $t$分布(頑健性向上)
- 混合正規分布(多峰性モデリング)
- 指数分布族(GLM との統合)
- スキュー分布(非対称性の取り込み)
3. 時変係数モデル:
$\mathbf{F}_t = \mathbf{F}(\boldsymbol{\theta}_t), \quad \mathbf{H}_t = \mathbf{H}(\boldsymbol{\xi}_t)$
パラメータ自体が時間変化する dynamic parameter モデル
| 拡張タイプ | 推定手法 | 適用例 |
|---|
| 非線形 | EKF, UKF, PF | ファイナンス、生態学 |
| 非ガウシアン | 粒子フィルタ、MCMC | リスク管理、品質管理 |
| 時変パラメータ | TVP-SVM、DLM | 経済政策、気候変動 |
| 混合モデル | IMM、RJMCMC | レジーム・スイッチング |
状態空間表現の統一性
Step 4: 様々な時系列モデルの統一表現
1. ARIMA(p,d,q) モデル:
$\text{ARIMA}(2,1,1): (1-\phi_1 L - \phi_2 L^2)(1-L)y_t = (1+\theta_1 L)\epsilon_t$
状態空間表現:
$\boldsymbol{\alpha}_t = \begin{pmatrix} \alpha_{1t} \\ \alpha_{2t} \\ \alpha_{3t} \end{pmatrix} = \begin{pmatrix} \phi_1+1 & \phi_2 & 0 \\ 1 & 0 & 0 \\ 0 & 0 & 0 \end{pmatrix} \begin{pmatrix} \alpha_{1,t-1} \\ \alpha_{2,t-1} \\ \alpha_{3,t-1} \end{pmatrix} + \begin{pmatrix} 1 \\ 1 \\ 1 \end{pmatrix} \epsilon_t$
$y_t = \begin{pmatrix} 1 & 0 & \theta_1 \end{pmatrix} \boldsymbol{\alpha}_t$
2. 構造時系列モデル:
$y_t = \mu_t + \gamma_t + \epsilon_t$ (レベル+季節成分)
$\begin{pmatrix} \mu_t \\ \gamma_t \\ \vdots \\ \gamma_{t-s+1} \end{pmatrix} = \begin{pmatrix} 1 & 0 & \cdots & 0 \\ 0 & -1 & \cdots & -1 \\ 0 & 1 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \end{pmatrix} \begin{pmatrix} \mu_{t-1} \\ \gamma_{t-1} \\ \vdots \\ \gamma_{t-s} \end{pmatrix} + \begin{pmatrix} \eta_{\mu,t} \\ \eta_{\gamma,t} \\ 0 \\ \vdots \end{pmatrix}$
3. 時変係数回帰:
$y_t = \mathbf{x}_t^T \boldsymbol{\beta}_t + \epsilon_t$, $\boldsymbol{\beta}_t = \boldsymbol{\beta}_{t-1} + \boldsymbol{\eta}_t$
$\mathbf{H}_t = \mathbf{x}_t^T, \quad \boldsymbol{\alpha}_t = \boldsymbol{\beta}_t, \quad \mathbf{F}_t = \mathbf{I}$
観測・状態の次元性
Step 5: 多変量・高次元への拡張
観測次元の拡張:
$\mathbf{y}_t = \begin{pmatrix} y_{1t} \\ y_{2t} \\ \vdots \\ y_{pt} \end{pmatrix}, \quad \mathbf{H}_t = \begin{pmatrix} h_{11,t} & h_{12,t} & \cdots & h_{1m,t} \\ h_{21,t} & h_{22,t} & \cdots & h_{2m,t} \\ \vdots & \vdots & \ddots & \vdots \\ h_{p1,t} & h_{p2,t} & \cdots & h_{pm,t} \end{pmatrix}$
状態次元の選択:
- 最小実現:必要最小限の状態数
- 可観測性:$(\mathbf{H}_t, \mathbf{F}_t)$ の可観測ペア条件
- 可制御性:$(\mathbf{F}_t, \mathbf{Q}_t^{1/2})$ の可制御ペア条件
高次元状態空間での課題:
- 計算複雑性:$O(m^3)$ の行列演算
- 数値安定性:条件数・特異値の管理
- identifiability:パラメータの識別可能性
- curse of dimensionality:高次元での推定精度
状態空間モデルの推定手法
Step 6: パラメータ推定の多様性
主要推定手法
| 手法 | 適用範囲 | 特徴 |
|---|
| 最尤法+カルマンフィルタ | 線形ガウシアン | 解析的、高速 |
| EMアルゴリズム | 欠測値、潜在変数 | 収束保証、安定 |
| 拡張カルマンフィルタ | 弱非線形 | 一次近似、高速 |
| 無香料カルマンフィルタ | 中程度非線形 | 高次精度、決定論的 |
| 粒子フィルタ | 強非線形・非ガウシアン | 汎用、計算集約 |
| MCMC | ベイズ推定 | 不確実性定量化 |
選択肢の詳細
Step 9: 各選択肢の理論的検討
選択肢A: 観測可能な状態変数のみで構成される
- ❌ 根本的誤解:状態空間モデルの本質は 潜在状態 のモデリング
- ❌ 観測されない状態$\boldsymbol{\alpha}_t$が中核概念
- ❌ もし状態が観測可能なら通常の回帰モデルで十分
選択肢B: 線形ガウシアンモデルに限定される
- ❌ 歴史的制限:初期は線形ガウシアンが主流
- ❌ 現在は非線形・非ガウシアンモデルが主要な研究領域
- ❌ 粒子フィルタ、深層学習との統合で拡張済み
選択肢C: 観測方程式と状態方程式の2つの方程式で構成される
- ✓ 正確な定義:これが状態空間モデルの基本構造
- ✓ 観測方程式:潜在状態と観測値の関係
- ✓ 状態方程式:潜在状態の時間発展
- ✓ この2方程式構造がフレームワークの核心
選択肢D: 時不変パラメータのみを扱う
- ❌ 柔軟性の否定:時変パラメータモデルは重要な拡張
- ❌ TVP-SSM、構造変化モデルなど活発な研究領域
- ❌ 実際の経済・社会現象は時変性を持つ場合が多い
状態空間モデルの理論的基礎
Step 10: 確率論的基礎
マルコフ性:
$p(\boldsymbol{\alpha}_t | \boldsymbol{\alpha}_{t-1}, \boldsymbol{\alpha}_{t-2}, \ldots, \boldsymbol{\alpha}_1) = p(\boldsymbol{\alpha}_t | \boldsymbol{\alpha}_{t-1})$
条件付き独立性:
$p(\mathbf{y}_t | \boldsymbol{\alpha}_t, \mathbf{y}_{t-1}, \ldots, \mathbf{y}_1) = p(\mathbf{y}_t | \boldsymbol{\alpha}_t)$
結合分布の分解:
$p(\mathbf{y}_{1:T}, \boldsymbol{\alpha}_{1:T}) = p(\boldsymbol{\alpha}_1) \prod_{t=2}^T p(\boldsymbol{\alpha}_t | \boldsymbol{\alpha}_{t-1}) \prod_{t=1}^T p(\mathbf{y}_t | \boldsymbol{\alpha}_t)$
状態空間モデルの確率構造
この確率構造により以下が可能になります:
- フィルタリング:$p(\boldsymbol{\alpha}_t | \mathbf{y}_{1:t})$ の計算
- 予測:$p(\mathbf{y}_{t+h} | \mathbf{y}_{1:t})$ の導出
- 平滑化:$p(\boldsymbol{\alpha}_t | \mathbf{y}_{1:T})$ の推定
- 尤度計算:$p(\mathbf{y}_{1:T})$ によるモデル選択
したがって、正解は「観測方程式と状態方程式の2つの方程式で構成される」です。この2方程式構造こそが状態空間モデルの定義的特徴であり、観測されない潜在状態の動学(状態方程式)と観測データとの関係(観測方程式)を同時にモデル化する革新的フレームワークの本質を表現しています。