操作変数法① - 多変量解析問題19 - 青の統計学-DS Playground-

操作変数法① レベル1

操作変数法において、内生変数$X$と結果変数$Y$の関係を分析する。操作変数$Z$が以下の条件を満たすとき、$X$が$Y$に与える因果効果を求めよ。\n\n**データ：**\n- $\text{Cov}(Z, X) = 15$\n- $\text{Cov}(Z, Y) = 6$\n- $\text{Var}(Z) = 12$\n- 操作変数$Z$は外生変数で、$Y$に直接の因果効果を持たない\n- $X$は内生変数（観察されない交絡因子の影響を受ける）

解説

解答と解説を表示

<h4>操作変数法：内生性問題への対処</h4><div class='key-point'><div class='key-point-title'>操作変数法の基本原理</div><p>操作変数法（Instrumental Variables Method）は、内生性問題が存在する場合に因果効果を一致推定するための手法です。観察されない交絡因子の影響を操作変数を用いて調整することで、真の因果関係を特定できます。</p></div><h4>操作変数法の理論的基盤</h4><p class='step'><strong>Step 1: 内生性問題の設定</strong></p><p><strong>構造方程式：</strong></p><div class='formula'>$Y = \alpha + \beta X + \epsilon

lt;/div><p>ここで：</p><ul><li>$Y$：結果変数</li><li>$X$：説明変数（内生変数）</li><li>$\beta$：因果効果（推定したいパラメータ）</li><li>$\epsilon$：誤差項（観察されない交絡因子を含む）</li></ul><p><strong>内生性の問題：</strong></p><div class='formula'>$E[X \epsilon] \neq 0

lt;/div><p>これにより、OLS推定量$\hat{\beta}_{OLS}$は一致性を失います。</p><div class='key-point'><h4>内生性の原因</h4><ul><li><strong>欠落変数バイアス</strong>：重要な変数の省略</li><li><strong>同時性バイアス</strong>：$X$と$Y$の双方向因果</li><li><strong>測定誤差</strong>：$X$の観測誤差</li><li><strong>選択バイアス</strong>：サンプル選択の非ランダム性</li></ul></div><p class='step'><strong>Step 2: 操作変数の条件</strong></p><p>有効な操作変数$Z$は以下の2つの条件を満たす必要があります：</p><p><strong>関連性条件（Relevance）：</strong></p><div class='formula'>$\text{Cov}(Z, X) \neq 0

lt;/div><p>操作変数は内生変数と相関を持つ</p><p><strong>外生性条件（Exogeneity）：</strong></p><div class='formula'>$\text{Cov}(Z, \epsilon) = 0

lt;/div><p>操作変数は誤差項と無相関（$Y$に直接影響しない）</p><div class='key-point'><h4>操作変数の直感的理解</h4><p>操作変数$Z$は「$X$の外生的変動」を生み出します。この変動は$\epsilon$と無関係なので、$Z$によって誘発された$X$の変化が$Y$に与える影響を観察することで、真の因果効果$\beta$を推定できます。</p></div><p class='step'><strong>Step 3: 2段階最小二乗法（2SLS）の理論</strong></p><p><strong>第1段階：</strong>内生変数を操作変数で予測</p><div class='formula'>$X = \gamma_0 + \gamma_1 Z + \nu

lt;/div><p><strong>第2段階：</strong>予測値を用いて構造方程式を推定</p><div class='formula'>$Y = \alpha + \beta \hat{X} + \eta

lt;/div><p>ここで、$\hat{X} = \hat{\gamma}_0 + \hat{\gamma}_1 Z

lt;/p><p class='step'><strong>Step 4: IV推定量の導出</strong></p><p><strong>操作変数推定量（Wald推定量）：</strong></p><div class='formula'>$\hat{\beta}_{IV} = \frac{\text{Cov}(Z, Y)}{\text{Cov}(Z, X)}

lt;/div><p><strong>導出過程：</strong></p><p>構造方程式から：</p><div class='formula'>$\text{Cov}(Z, Y) = \text{Cov}(Z, \alpha + \beta X + \epsilon)

lt;/div><div class='formula'>$= \beta \text{Cov}(Z, X) + \text{Cov}(Z, \epsilon)

lt;/div><p>外生性条件により$\text{Cov}(Z, \epsilon) = 0$なので：</p><div class='formula'>$\text{Cov}(Z, Y) = \beta \text{Cov}(Z, X)

lt;/div><p>したがって：</p><div class='formula'>$\beta = \frac{\text{Cov}(Z, Y)}{\text{Cov}(Z, X)}

lt;/div><p class='step'><strong>Step 5: 与えられたデータによる計算</strong></p><p><strong>与えられた情報：</strong></p><ul><li>$\text{Cov}(Z, X) = 15

lt;/li><li>$\text{Cov}(Z, Y) = 6

lt;/li><li>$\text{Var}(Z) = 12

lt;/li></ul><p><strong>IV推定量の計算：</strong></p><div class='formula'>$\hat{\beta}_{IV} = \frac{\text{Cov}(Z, Y)}{\text{Cov}(Z, X)} = \frac{6}{15} = 0.4

lt;/div><div class='key-point'><h4>結果の解釈</h4><table class='table table-bordered'><tr><th>項目</th><th>値</th><th>解釈</th></tr><tr><td><strong>因果効果</strong></td><td>$\hat{\beta}_{IV} = 0.4

lt;/td><td>$X$が1単位増加すると$Y$が0.4単位増加</td></tr><tr><td><strong>第1段階F統計量</strong></td><td>関連性の強さ</td><td>$\text{Cov}(Z,X)^2/\text{Var}(Z) = 225/12 = 18.75

lt;/td></tr><tr><td><strong>弱操作変数の懸念</strong></td><td>F > 10</td><td>十分に強い操作変数</td></tr></table></div><p class='step'><strong>Step 6: 操作変数の強さの評価</strong></p><p><strong>第1段階の決定係数：</strong></p><p>$X$と$Z$の相関係数を仮に$r_{XZ} = 0.5$とすると：</p><div class='formula'>$R^2_1 = r_{XZ}^2 = 0.25

lt;/div><p><strong>弱操作変数の問題：</strong></p><ul><li>$\text{Cov}(Z, X)$が小さいとIV推定量の分散が大きくなる</li><li>有限サンプルでバイアスが生じる可能性</li><li>第1段階F統計量 > 10 が経験則</li></ul><p class='step'><strong>Step 7: 推定量の統計的性質</strong></p><p><strong>一致性：</strong></p><p>操作変数条件が満たされれば：</p><div class='formula'>$\text{plim} \, \hat{\beta}_{IV} = \beta

lt;/div><p><strong>漸近分布：</strong></p><div class='formula'>$\sqrt{n}(\hat{\beta}_{IV} - \beta) \xrightarrow{d} N(0, \sigma^2_{IV})

lt;/div><p>ここで：</p><div class='formula'>$\sigma^2_{IV} = \frac{\sigma^2_\epsilon}{\sigma^2_X \rho^2_{ZX}}

lt;/div><p class='step'><strong>Step 8: 実証的検証</strong></p><p><strong>過剰識別検定（Sargan検定）：</strong></p><p>複数の操作変数がある場合、外生性の検定が可能</p><p><strong>Wu-Hausman検定：</strong></p><p>内生性の有無を検定</p><div class='formula'>$H_0: \hat{\beta}_{OLS} = \hat{\beta}_{IV}$ （内生性なし）</div><p class='step'><strong>Step 9: 注意点と限界</strong></p><div class='key-point'><h4>操作変数法の課題</h4><ul><li><strong>弱操作変数</strong>：関連性が弱いと推定精度が低下</li><li><strong>外生性の検証困難</strong>：観察不可能な仮定</li><li><strong>局所平均処置効果</strong>：特定の部分集団の効果のみ推定</li><li><strong>単調性仮定</strong>：操作変数の効果の方向が一様</li></ul></div><h4>代表的な操作変数の例</h4><ul><li><strong>教育収益率</strong>：義務教育年限の変更、双子研究</li><li><strong>軍事サービス</strong>：徴兵制度、抽選番号</li><li><strong>地理的変数</strong>：距離、気候条件</li><li><strong>制度変更</strong>：法律改正、政策変更</li></ul><p class='step'><strong>Step 10: 経済的解釈</strong></p><p>推定された因果効果$\hat{\beta}_{IV} = 0.4$は、操作変数によって誘発された$X$の変動に対する$Y$の反応を表します。これは：</p><ul><li><strong>局所平均処置効果</strong>：操作変数に反応する「complier」の効果</li><li><strong>外生的変動</strong>：交絡因子の影響を除いた純粋な因果効果</li><li><strong>政策的含意</strong>：$X$を外生的に変化させた場合の予想される効果</li></ul><h4>他の内生性対処法との比較</h4><div class='key-point'><table class='table table-bordered'><tr><th>手法</th><th>仮定</th><th>適用場面</th><th>利点・欠点</th></tr><tr><td><strong>操作変数法</strong></td><td>有効な操作変数の存在</td><td>観察不可能な交絡</td><td>強い識別力、仮定の検証困難</td></tr><tr><td><strong>固定効果</strong></td><td>時間不変の個体効果</td><td>パネルデータ</td><td>実装容易、時変交絡は除去不可</td></tr><tr><td><strong>差分の差分</strong></td><td>平行トレンド仮定</td><td>自然実験</td><td>政策評価に有効、仮定の検証可能</td></tr><tr><td><strong>回帰不連続</strong></td><td>閾値周辺の局所ランダム化</td><td>rule-based割り当て</td><td>内的妥当性高、外的妥当性限定</td></tr></table></div>