ARIMAモデルの識別 - 時系列解析問題4 - 青の統計学-DS Playground-

ARIMAモデルの識別レベル1

時系列データに対してARIMAモデルを適用する際のモデル識別について、正しい記述はどれか。

解説

解答と解説を表示

<h4>ARIMAモデル識別：Box-Jenkins法の体系的アプローチ</h4><div class='key-point'><div class='key-point-title'>モデル識別の重要性</div><p>ARIMAモデルの識別は時系列解析の成功を左右する最もステップです。適切な識別により、データの本質的な構造を捉え、信頼性の高い予測と推論を可能にします。Box-Jenkins法（1970）により体系化されたこの手法は、現在でも時系列分析の基礎となっています。</p></div><h4>Box-Jenkins法の3段階プロセス</h4><p class='step'><strong>Step 1: 識別（Identification）段階</strong></p><p><strong>1.1 定常性の確認と変換</strong></p><div class='key-point'><div class='key-point-title'>定常化の体系的手順</div><ol><li><strong>視覚的診断</strong><ul><li>時系列プロット：トレンド、季節性、分散変化の確認</li><li>散布図：ラグプロットによる線形関係の検証</li></ul></li><li><strong>統計的検定</strong><ul><li>ADF検定：$H_0$: 単位根存在（非定常）</li><li>KPSS検定：$H_0$: 定常性</li><li>Phillips-Perron検定：系列相関に頑健</li></ul></li><li><strong>変換の適用</strong><ul><li>差分：$\nabla^d X_t = (1-B)^d X_t

lt;/li><li>季節差分：$\nabla_s X_t = (1-B^s) X_t

lt;/li><li>Box-Cox変換：分散安定化</li></ul></li></ol></div><p><strong>1.2 ACF・PACFによる次数決定</strong></p><p>定常化されたデータに対して、自己相関関数（ACF）と偏自己相関関数（PACF）のパターンを分析します：</p><table style='width:100%; border-collapse: collapse; margin: 1em 0;'><tr style='background-color: #f5f5f5;'><th style='border: 1px solid #ddd; padding: 8px;'>モデル</th><th style='border: 1px solid #ddd; padding: 8px;'>ACFの特徴</th><th style='border: 1px solid #ddd; padding: 8px;'>PACFの特徴</th><th style='border: 1px solid #ddd; padding: 8px;'>識別方法</th></tr><tr><td style='border: 1px solid #ddd; padding: 8px;'><strong>AR(p)</strong></td><td style='border: 1px solid #ddd; padding: 8px;'>指数的減衰または振動減衰</td><td style='border: 1px solid #ddd; padding: 8px;'>ラグ$p$で切断</td><td style='border: 1px solid #ddd; padding: 8px;'>PACFの切断点から$p$を決定</td></tr><tr><td style='border: 1px solid #ddd; padding: 8px;'><strong>MA(q)</strong></td><td style='border: 1px solid #ddd; padding: 8px;'>ラグ$q$で切断</td><td style='border: 1px solid #ddd; padding: 8px;'>指数的減衰または振動減衰</td><td style='border: 1px solid #ddd; padding: 8px;'>ACFの切断点から$q$を決定</td></tr><tr><td style='border: 1px solid #ddd; padding: 8px;'><strong>ARMA(p,q)</strong></td><td style='border: 1px solid #ddd; padding: 8px;'>ラグ$q$以降で指数的減衰</td><td style='border: 1px solid #ddd; padding: 8px;'>ラグ$p$以降で指数的減衰</td><td style='border: 1px solid #ddd; padding: 8px;'>両方の減衰パターンから推定</td></tr></table><h4>ACF・PACFの数学的定義と計算</h4><p class='step'><strong>Step 2: 相関構造の詳細分析</strong></p><p><strong>自己相関関数（ACF）：</strong></p><div class='formula'>$\rho(h) = \frac{\gamma(h)}{\gamma(0)} = \frac{\text{Cov}(X_t, X_{t+h})}{\text{Var}(X_t)}

lt;/div><p>標本ACF：</p><div class='formula'>$\hat{\rho}(h) = \frac{\hat{\gamma}(h)}{\hat{\gamma}(0)} = \frac{\frac{1}{n}\sum_{t=1}^{n-h}(X_t - \bar{X})(X_{t+h} - \bar{X})}{\frac{1}{n}\sum_{t=1}^{n}(X_t - \bar{X})^2}

lt;/div><p><strong>偏自己相関関数（PACF）：</strong></p><p>ラグ$h$での偏自己相関$\phi_{hh}$は、中間のラグ$1, 2, \ldots, h-1$の影響を除去した$X_t$と$X_{t+h}$の相関：</p><div class='formula'>$\phi_{hh} = \text{Corr}(X_t - \hat{X}_t, X_{t+h} - \hat{X}_{t+h})

lt;/div><p>ここで、$\hat{X}_t$、$\hat{X}_{t+h}$はそれぞれ$X_{t+1}, \ldots, X_{t+h-1}$による線形予測値</p><div class='key-point'><div class='key-point-title'>Yule-Walker方程式による計算</div><p>AR(h)モデルのパラメータとして偏自己相関を計算：</p><div class='formula'>$\begin{bmatrix}1 & \rho(1) & \rho(2) & \cdots & \rho(h-1) \\\rho(1) & 1 & \rho(1) & \cdots & \rho(h-2) \\\vdots & \vdots & \vdots & \ddots & \vdots \\\rho(h-1) & \rho(h-2) & \rho(h-3) & \cdots & 1\end{bmatrix} \begin{bmatrix}\phi_{h1} \\\phi_{h2} \\\vdots \\\phi_{hh}\end{bmatrix} = \begin{bmatrix}\rho(1) \\\rho(2) \\\vdots \\\rho(h)\end{bmatrix}

lt;/div></div><h4>情報量規準によるモデル選択</h4><p class='step'><strong>Step 3: 定量的モデル比較</strong></p><p>ACF・PACFによる初期識別後、情報量規準により最終的なモデルを選択します：</p><p><strong>主要な情報量規準：</strong></p><div class='formula'>$\begin{align}\text{AIC} &= -2\log L(\hat{\theta}) + 2k \\\text{BIC} &= -2\log L(\hat{\theta}) + k\log n \\\text{HQIC} &= -2\log L(\hat{\theta}) + 2k\log\log n\end{align}

lt;/div><p>ここで、$L(\hat{\theta})$は最大尤度、$k$はパラメータ数、$n$は観測数</p><table style='width:100%; border-collapse: collapse; margin: 1em 0;'><tr style='background-color: #f5f5f5;'><th style='border: 1px solid #ddd; padding: 8px;'>規準</th><th style='border: 1px solid #ddd; padding: 8px;'>特徴</th><th style='border: 1px solid #ddd; padding: 8px;'>適用場面</th><th style='border: 1px solid #ddd; padding: 8px;'>ペナルティ</th></tr><tr><td style='border: 1px solid #ddd; padding: 8px;'>AIC</td><td style='border: 1px solid #ddd; padding: 8px;'>予測重視</td><td style='border: 1px solid #ddd; padding: 8px;'>予測精度優先</td><td style='border: 1px solid #ddd; padding: 8px;'>軽い</td></tr><tr><td style='border: 1px solid #ddd; padding: 8px;'>BIC</td><td style='border: 1px solid #ddd; padding: 8px;'>簡潔性重視</td><td style='border: 1px solid #ddd; padding: 8px;'>真のモデル選択</td><td style='border: 1px solid #ddd; padding: 8px;'>重い</td></tr><tr><td style='border: 1px solid #ddd; padding: 8px;'>HQIC</td><td style='border: 1px solid #ddd; padding: 8px;'>中間的</td><td style='border: 1px solid #ddd; padding: 8px;'>バランス重視</td><td style='border: 1px solid #ddd; padding: 8px;'>中程度</td></tr></table><h4>推定と診断の統合プロセス</h4><p class='step'><strong>Step 4: 推定（Estimation）段階</strong></p><p><strong>最尤推定法：</strong></p><p>ARIMA(p,d,q)モデルのパラメータ$\theta = (\phi_1, \ldots, \phi_p, \theta_1, \ldots, \theta_q, \sigma^2)$を推定：</p><div class='formula'>$\hat{\theta} = \arg\max_{\theta} L(\theta) = \arg\max_{\theta} \prod_{t=1}^{n} f(x_t | x_{t-1}, \ldots, x_1; \theta)

lt;/div><p><strong>条件付き最小二乗法：</strong></p><div class='formula'>$\hat{\theta} = \arg\min_{\theta} \sum_{t=p+1}^{n} [x_t - \phi_1 x_{t-1} - \cdots - \phi_p x_{t-p} - \theta_1 \epsilon_{t-1} - \cdots - \theta_q \epsilon_{t-q}]^2

lt;/div><p class='step'><strong>Step 5: 診断（Diagnostic）段階</strong></p><div class='key-point'><div class='key-point-title'>包括的残差診断</div><ol><li><strong>系列無相関性検定</strong><ul><li>Ljung-Box検定：$Q_{LB} = n(n+2)\sum_{h=1}^H \frac{\hat{\rho}_h^2}{n-h} \sim \chi^2(H-p-q)

lt;/li><li>Box-Pierce検定：$Q_{BP} = n\sum_{h=1}^H \hat{\rho}_h^2 \sim \chi^2(H-p-q)

lt;/li></ul></li><li><strong>正規性検定</strong><ul><li>Jarque-Bera検定：$JB = \frac{n}{6}[S^2 + \frac{(K-3)^2}{4}] \sim \chi^2(2)

lt;/li><li>Shapiro-Wilk検定</li></ul></li><li><strong>異分散性検定</strong><ul><li>ARCH-LM検定</li><li>Breusch-Pagan検定</li></ul></li><li><strong>構造安定性検定</strong><ul><li>CUSUM検定</li><li>recursive residuals</li></ul></li></ol></div><h4>実践的な識別戦略</h4><p class='step'><strong>Step 6: 現代的アプローチの統合</strong></p><p><strong>1. 自動選択アルゴリズム</strong></p><p>Hyndman-Khandakar アルゴリズム（auto.arima）：</p><ol><li>単位根検定による差分次数$d$の決定</li><li>情報量規準による$(p,q)$の格子探索</li><li>段階的選択による効率的探索</li><li>季節性の自動検出と対応</li></ol><p><strong>2. 交差検証による予測性能評価</strong></p><div class='formula'>$\text{MAPE} = \frac{1}{h} \sum_{i=1}^{h} \left| \frac{y_{n+i} - \hat{y}_{n+i|n}}{y_{n+i}} \right| \times 100\%

lt;/div><p><strong>3. アンサンブル手法</strong></p><ul><li>複数のARIMAモデルの重み付き平均</li><li>ベイジアンモデル平均（BMA）</li><li>機械学習手法との組み合わせ</li></ul><h4>季節性とSARIMAへの拡張</h4><p class='step'><strong>Step 7: 季節時系列の特別な考慮</strong></p><p><strong>SARIMA(p,d,q)(P,D,Q)s モデル：</strong></p><div class='formula'>$\Phi(B^s)\phi(B)(1-B)^d(1-B^s)^D X_t = \Theta(B^s)\theta(B)\epsilon_t

lt;/div><p><strong>季節性の識別指標：</strong></p><ul><li>季節ラグでのACF・PACFの有意性</li><li>季節差分後の定常性</li><li>スペクトル解析による周期性検出</li></ul><div class='key-point'><div class='key-point-title'>季節性判定の実践的手順</div><ol><li><strong>視覚的確認</strong>：季節プロット、月別ボックスプロット</li><li><strong>統計的検定</strong>：Kruskal-Wallis検定、QS検定</li><li><strong>自動検出</strong>：X-13ARIMA-SEATS、TRAMO-SEATS</li><li><strong>機械学習</strong>：STL分解、Prophet</li></ol></div><h4>他の選択肢の詳細検討</h4><p class='step'><strong>Step 8: 誤った識別手法の問題点</strong></p><p><strong>選択肢B: AICのみを用いて最適なモデルを選択する</strong></p><ul><li>❌ 単一規準の限界：過適合のリスク</li><li>❌ ACF・PACFの無視：構造的理解の欠如</li><li>❌ 診断の軽視：仮定違反の見落とし</li><li>✓ 改善案：複数規準の併用、段階的選択</li></ul><p><strong>選択肢C: データの長さから自動的に次数が決まる</strong></p><ul><li>❌ データ生成過程の無視：構造に基づかない選択</li><li>❌ 統計的根拠の欠如：恣意的な決定</li><li>❌ 一般化の困難：異なるデータへの適用不可</li><li>✓ 正しいアプローチ：データの特性に基づく識別</li></ul><p><strong>選択肢D: 季節性があれば必ずSARIMAモデルを使用する</strong></p><ul><li>❌ 過度の一般化：季節性の種類を無視</li><li>❌ 代替手法の軽視：状態空間モデル、STL等</li><li>❌ 複雑性の無視：パラメータ数の増大</li><li>✓ 適切な判断：季節性の性質に応じた選択</li></ul></p>