AIC、BIC、交差検証、ROC曲線、混合行列など、統計モデルの選択と評価に関する手法
小標本サイズにおけるAICの偏りを補正する修正AIC(c-AIC)について、正しい記述はどれか。
この問題では、小標本サイズにおけるAICの偏りを補正する修正AIC(c-AIC: corrected AIC)について理解を深めます。c-AICは実際の統計解析において、特に小さなデータセットでの適切なモデル選択を可能にする手法です。[[memory:1942104]]
Step 1: 標準AICの理論的基礎と限界
標準AICの定義:
この式は漸近理論に基づいており、サンプルサイズ$n$が十分に大きい場合に成立します。
小標本における問題:
偏りの発生メカニズム:
理論的には、AICは真のリスクの不偏推定量となるはずですが、小標本では系統的な偏りが生じます。
Step 2: 修正AIC(c-AIC)の導出
Hurvich & Tsai (1989)による修正:
この修正項は、小標本におけるAICの偏りを補正するために導入されました。
修正項の詳細解析:
この項の特徴:
理論的根拠:
c-AICは、条件付き最大尤度に基づく正確な期待値計算から導出されます:
これにより、$O(1/n)$の精度でリスクの不偏推定が可能になります。
Step 3: 修正項の挙動分析
サンプルサイズ効果:
パラメータ数$k=5$の場合の修正項の変化:
$n$ | $\\frac{2k(k+1)}{n-k-1}$ | AICとの差 | 影響度 |
---|---|---|---|
20 | 4.29 | 大きい | モデル選択に大きく影響 |
50 | 1.36 | 中程度 | 選択に影響する可能性 |
100 | 0.64 | 小さい | 軽微な影響 |
500 | 0.12 | 無視できる | ほぼ影響なし |
パラメータ数効果:
$n=30$の場合の修正項の変化:
パラメータ数が多いほど、修正項は急激に増加します。
Step 4: 具体的な計算例
設定:
標準AICの計算:
修正AIC(c-AIC)の計算:
解釈:
Step 5: 複数モデルでの比較例
3つのモデルの比較:
モデル | $k$ | $\\ln L$ | AIC | c-AIC | 順位(AIC) | 順位(c-AIC) |
---|---|---|---|---|---|---|
A | 2 | -52 | 108 | 108.5 | 2 | 1 |
B | 4 | -50 | 108 | 110 | 1 | 2 |
C | 6 | -48 | 108 | 112.7 | 1 | 3 |
重要な発見:
Step 6: 使い分けの判断基準
c-AICを使用すべき場面:
標準AICで十分な場面:
Step 7: 実装上の注意点
数値的安定性:
条件: $n > k + 1$ が必要です。この条件が満たされない場合、c-AICは定義されません。
境界条件での処理:
計算上の工夫: