操作変数法:内生性問題への対処
操作変数法の基本原理
操作変数法(Instrumental Variables Method)は、内生性問題が存在する場合に因果効果を一致推定するための手法です。観察されない交絡因子の影響を操作変数を用いて調整することで、真の因果関係を特定できます。
操作変数法の理論的基盤
Step 1: 内生性問題の設定
構造方程式:
$Y = \alpha + \beta X + \epsilon$
ここで:
- $Y$:結果変数
- $X$:説明変数(内生変数)
- $\beta$:因果効果(推定したいパラメータ)
- $\epsilon$:誤差項(観察されない交絡因子を含む)
内生性の問題:
$E[X \epsilon] \neq 0$
これにより、OLS推定量$\hat{\beta}_{OLS}$は一致性を失います。
内生性の原因
- 欠落変数バイアス:重要な変数の省略
- 同時性バイアス:$X$と$Y$の双方向因果
- 測定誤差:$X$の観測誤差
- 選択バイアス:サンプル選択の非ランダム性
Step 2: 操作変数の条件
有効な操作変数$Z$は以下の2つの条件を満たす必要があります:
関連性条件(Relevance):
$\text{Cov}(Z, X) \neq 0$
操作変数は内生変数と相関を持つ
外生性条件(Exogeneity):
$\text{Cov}(Z, \epsilon) = 0$
操作変数は誤差項と無相関($Y$に直接影響しない)
操作変数の直感的理解
操作変数$Z$は「$X$の外生的変動」を生み出します。この変動は$\epsilon$と無関係なので、$Z$によって誘発された$X$の変化が$Y$に与える影響を観察することで、真の因果効果$\beta$を推定できます。
Step 3: 2段階最小二乗法(2SLS)の理論
第1段階:内生変数を操作変数で予測
$X = \gamma_0 + \gamma_1 Z + \nu$
第2段階:予測値を用いて構造方程式を推定
$Y = \alpha + \beta \hat{X} + \eta$
ここで、$\hat{X} = \hat{\gamma}_0 + \hat{\gamma}_1 Z$
Step 4: IV推定量の導出
操作変数推定量(Wald推定量):
$\hat{\beta}_{IV} = \frac{\text{Cov}(Z, Y)}{\text{Cov}(Z, X)}$
導出過程:
構造方程式から:
$\text{Cov}(Z, Y) = \text{Cov}(Z, \alpha + \beta X + \epsilon)$
$= \beta \text{Cov}(Z, X) + \text{Cov}(Z, \epsilon)$
外生性条件により$\text{Cov}(Z, \epsilon) = 0$なので:
$\text{Cov}(Z, Y) = \beta \text{Cov}(Z, X)$
したがって:
$\beta = \frac{\text{Cov}(Z, Y)}{\text{Cov}(Z, X)}$
Step 5: 与えられたデータによる計算
与えられた情報:
- $\text{Cov}(Z, X) = 15$
- $\text{Cov}(Z, Y) = 6$
- $\text{Var}(Z) = 12$
IV推定量の計算:
$\hat{\beta}_{IV} = \frac{\text{Cov}(Z, Y)}{\text{Cov}(Z, X)} = \frac{6}{15} = 0.4$
結果の解釈
| 項目 | 値 | 解釈 |
|---|
| 因果効果 | $\hat{\beta}_{IV} = 0.4$ | $X$が1単位増加すると$Y$が0.4単位増加 |
| 第1段階F統計量 | 関連性の強さ | $\text{Cov}(Z,X)^2/\text{Var}(Z) = 225/12 = 18.75$ |
| 弱操作変数の懸念 | F > 10 | 十分に強い操作変数 |
Step 6: 操作変数の強さの評価
第1段階の決定係数:
$X$と$Z$の相関係数を仮に$r_{XZ} = 0.5$とすると:
$R^2_1 = r_{XZ}^2 = 0.25$
弱操作変数の問題:
- $\text{Cov}(Z, X)$が小さいとIV推定量の分散が大きくなる
- 有限サンプルでバイアスが生じる可能性
- 第1段階F統計量 > 10 が経験則
Step 7: 推定量の統計的性質
一致性:
操作変数条件が満たされれば:
$\text{plim} \, \hat{\beta}_{IV} = \beta$
漸近分布:
$\sqrt{n}(\hat{\beta}_{IV} - \beta) \xrightarrow{d} N(0, \sigma^2_{IV})$
ここで:
$\sigma^2_{IV} = \frac{\sigma^2_\epsilon}{\sigma^2_X \rho^2_{ZX}}$
Step 8: 実証的検証
過剰識別検定(Sargan検定):
複数の操作変数がある場合、外生性の検定が可能
Wu-Hausman検定:
内生性の有無を検定
$H_0: \hat{\beta}_{OLS} = \hat{\beta}_{IV}$ (内生性なし)
Step 9: 注意点と限界
操作変数法の課題
- 弱操作変数:関連性が弱いと推定精度が低下
- 外生性の検証困難:観察不可能な仮定
- 局所平均処置効果:特定の部分集団の効果のみ推定
- 単調性仮定:操作変数の効果の方向が一様
代表的な操作変数の例
- 教育収益率:義務教育年限の変更、双子研究
- 軍事サービス:徴兵制度、抽選番号
- 地理的変数:距離、気候条件
- 制度変更:法律改正、政策変更
Step 10: 経済的解釈
推定された因果効果$\hat{\beta}_{IV} = 0.4$は、操作変数によって誘発された$X$の変動に対する$Y$の反応を表します。これは:
- 局所平均処置効果:操作変数に反応する「complier」の効果
- 外生的変動:交絡因子の影響を除いた純粋な因果効果
- 政策的含意:$X$を外生的に変化させた場合の予想される効果
他の内生性対処法との比較
| 手法 | 仮定 | 適用場面 | 利点・欠点 |
|---|
| 操作変数法 | 有効な操作変数の存在 | 観察不可能な交絡 | 強い識別力、仮定の検証困難 |
| 固定効果 | 時間不変の個体効果 | パネルデータ | 実装容易、時変交絡は除去不可 |
| 差分の差分 | 平行トレンド仮定 | 自然実験 | 政策評価に有効、仮定の検証可能 |
| 回帰不連続 | 閾値周辺の局所ランダム化 | rule-based割り当て | 内的妥当性高、外的妥当性限定 |