主成分分析、因子分析、判別分析、クラスター分析など統計検定準1級レベルの多変量統計手法を学習します。
二段階最小二乗法(2SLS)を用いて内生性問題に対処する。以下のデータで処置効果$\beta_1$を推定せよ。\n\n**設定:**\n- 構造方程式:$y_i = \beta_0 + \beta_1 x_i + \epsilon_i$\n- 第1段階回帰:$x_i = \gamma_0 + \gamma_1 z_i + v_i$\n- 操作変数$z$は外生変数\n\n**データ(n=5):**\n\n| i | $y_i$ | $x_i$ | $z_i$ |\n|---|-------|-------|-------|\n| 1 | 8 | 3 | 2 |\n| 2 | 12 | 5 | 4 |\n| 3 | 10 | 4 | 3 |\n| 4 | 14 | 6 | 5 |\n| 5 | 6 | 2 | 1 |\n\n小数第2位まで求めること。
二段階最小二乗法(Two-Stage Least Squares, 2SLS)は、内生性問題が存在する場合に一致推定量を得るための手法です。操作変数を用いて内生変数の外生的変動部分のみを抽出し、因果効果を推定します。
Step 1: 内生性問題の設定
構造方程式:
ここで、$x_i$は内生変数($E[x_i \\epsilon_i] \\neq 0$)のため、OLS推定量は一致性を失います。
操作変数$z_i$の条件:
第1段階:内生変数を操作変数で回帰
第2段階:予測値を用いて構造方程式を推定
Step 2: 与えられたデータの整理
観測データ:
観測$i$ | $y_i$ | $x_i$ | $z_i$ |
---|---|---|---|
1 | 8 | 3 | 2 |
2 | 12 | 5 | 4 |
3 | 10 | 4 | 3 |
4 | 14 | 6 | 5 |
5 | 6 | 2 | 1 |
基本統計量の計算:
Step 3: 第1段階回帰の実行
第1段階回帰式:
必要な計算:
第1段階のOLS推定量:
偏差の計算:
$i$ | $z_i - \\bar{z}$ | $x_i - \\bar{x}$ | $(z_i - \\bar{z})(x_i - \\bar{x})$ | $(z_i - \\bar{z})^2$ |
---|---|---|---|---|
1 | -1 | -1 | 1 | 1 |
2 | 1 | 1 | 1 | 1 |
3 | 0 | 0 | 0 | 0 |
4 | 2 | 2 | 4 | 4 |
5 | -2 | -2 | 4 | 4 |
合計 | 0 | 0 | 10 | 10 |
第1段階の推定値:
Step 4: 予測値の計算
第1段階の予測式:
各観測の予測値:
$i$ | $z_i$ | $\\hat{x}_i = 1 + z_i$ |
---|---|---|
1 | 2 | 3 |
2 | 4 | 5 |
3 | 3 | 4 |
4 | 5 | 6 |
5 | 1 | 2 |
注:この例では$\\hat{x}_i = x_i$となっていますが、これは偶然です。一般的には異なります。
Step 5: 第2段階回帰の実行
第2段階回帰式:
必要な計算:
第2段階の偏差計算:
$i$ | $y_i - \\bar{y}$ | $\\hat{x}_i - \\bar{\\hat{x}}$ | $(y_i - \\bar{y})(\\hat{x}_i - \\bar{\\hat{x}})$ | $(\\hat{x}_i - \\bar{\\hat{x}})^2$ |
---|---|---|---|---|
1 | -2 | -1 | 2 | 1 |
2 | 2 | 1 | 2 | 1 |
3 | 0 | 0 | 0 | 0 |
4 | 4 | 2 | 8 | 4 |
5 | -4 | -2 | 8 | 4 |
合計 | 0 | 0 | 20 | 10 |
Step 6: 2SLS推定量の計算
構造パラメータの推定:
Step 7: 結果の検証
操作変数推定量(Wald推定量)による確認:
共分散の計算:
両方の方法で同じ結果が得られました。
推定量 | 値 | 解釈 |
---|---|---|
$\\hat{\\beta}_1^{2SLS}$ | 2 | 処置効果の2SLS推定値 |
$\\hat{\\beta}_0^{2SLS}$ | 3.32 | 切片の2SLS推定値 |
第1段階F統計量 | 高い | 操作変数の強さ |
Step 8: 2SLS推定量の統計的性質
一致性:
操作変数条件が満たされれば:
漸近分布:
Step 9: OLSとの比較
OLS推定量:
$(x_i - \\bar{x})(y_i - \\bar{y})$の計算:$(-1)(-2) + (1)(2) + (0)(0) + (2)(4) + (-2)(-4) = 20$
この例では内生性がそれほど深刻でないため、OLSと2SLSの結果が近くなっています。