多変量解析

主成分分析、因子分析、判別分析、クラスター分析など統計検定準1級レベルの多変量統計手法を学習します。

二段階OLSに関する計算問題 レベル1

二段階最小二乗法(2SLS)を用いて内生性問題に対処する。以下のデータで処置効果$\beta_1$を推定せよ。\n\n**設定:**\n- 構造方程式:$y_i = \beta_0 + \beta_1 x_i + \epsilon_i$\n- 第1段階回帰:$x_i = \gamma_0 + \gamma_1 z_i + v_i$\n- 操作変数$z$は外生変数\n\n**データ(n=5):**\n\n| i | $y_i$ | $x_i$ | $z_i$ |\n|---|-------|-------|-------|\n| 1 | 8 | 3 | 2 |\n| 2 | 12 | 5 | 4 |\n| 3 | 10 | 4 | 3 |\n| 4 | 14 | 6 | 5 |\n| 5 | 6 | 2 | 1 |\n\n小数第2位まで求めること。

解説
解答と解説を表示
&

二段階最小二乗法(2SLS)による内生性問題の解決

2SLSの基本原理

二段階最小二乗法(Two-Stage Least Squares, 2SLS)は、内生性問題が存在する場合に一致推定量を得るための手法です。操作変数を用いて内生変数の外生的変動部分のみを抽出し、因果効果を推定します。

2SLSの理論的基盤

Step 1: 内生性問題の設定

構造方程式:

$y_i = \\beta_0 + \\beta_1 x_i + \\epsilon_i$

ここで、$x_i$は内生変数($E[x_i \\epsilon_i] \\neq 0$)のため、OLS推定量は一致性を失います。

操作変数$z_i$の条件:

  • 関連性:$\\text{Cov}(z_i, x_i) \\neq 0$
  • 外生性:$\\text{Cov}(z_i, \\epsilon_i) = 0$

2SLSの2つの段階

第1段階:内生変数を操作変数で回帰
第2段階:予測値を用いて構造方程式を推定

Step 2: 与えられたデータの整理

観測データ:

観測$i$$y_i$$x_i$$z_i$
1832
21254
31043
41465
5621

基本統計量の計算:

  • $\\bar{y} = \\frac{8+12+10+14+6}{5} = \\frac{50}{5} = 10$
  • $\\bar{x} = \\frac{3+5+4+6+2}{5} = \\frac{20}{5} = 4$
  • $\\bar{z} = \\frac{2+4+3+5+1}{5} = \\frac{15}{5} = 3$

Step 3: 第1段階回帰の実行

第1段階回帰式:

$x_i = \\gamma_0 + \\gamma_1 z_i + v_i$

必要な計算:

  • $\\sum z_i^2 = 2^2 + 4^2 + 3^2 + 5^2 + 1^2 = 4 + 16 + 9 + 25 + 1 = 55$
  • $\\sum x_i z_i = 3 \\times 2 + 5 \\times 4 + 4 \\times 3 + 6 \\times 5 + 2 \\times 1 = 6 + 20 + 12 + 30 + 2 = 70$

第1段階のOLS推定量:

$\\hat{\\gamma}_1 = \\frac{\\sum(z_i - \\bar{z})(x_i - \\bar{x})}{\\sum(z_i - \\bar{z})^2}$

偏差の計算:

$i$$z_i - \\bar{z}$$x_i - \\bar{x}$$(z_i - \\bar{z})(x_i - \\bar{x})$$(z_i - \\bar{z})^2$
1-1-111
21111
30000
42244
5-2-244
合計001010

第1段階の推定値:

$\\hat{\\gamma}_1 = \\frac{10}{10} = 1.0$
$\\hat{\\gamma}_0 = \\bar{x} - \\hat{\\gamma}_1 \\bar{z} = 4 - 1.0 \\times 3 = 1.0$

Step 4: 予測値の計算

第1段階の予測式:

$\\hat{x}_i = \\hat{\\gamma}_0 + \\hat{\\gamma}_1 z_i = 1.0 + 1.0 \\times z_i$

各観測の予測値:

$i$$z_i$$\\hat{x}_i = 1 + z_i$
123
245
334
456
512

注:この例では$\\hat{x}_i = x_i$となっていますが、これは偶然です。一般的には異なります。

Step 5: 第2段階回帰の実行

第2段階回帰式:

$y_i = \\beta_0 + \\beta_1 \\hat{x}_i + \\eta_i$

必要な計算:

  • $\\bar{\\hat{x}} = \\frac{3+5+4+6+2}{5} = 4$(第1段階の性質により$\\bar{\\hat{x}} = \\bar{x}$)
  • $\\sum \\hat{x}_i^2 = 3^2 + 5^2 + 4^2 + 6^2 + 2^2 = 9 + 25 + 16 + 36 + 4 = 90$
  • $\\sum y_i \\hat{x}_i = 8 \\times 3 + 12 \\times 5 + 10 \\times 4 + 14 \\times 6 + 6 \\times 2 = 24 + 60 + 40 + 84 + 12 = 220$

第2段階の偏差計算:

$i$$y_i - \\bar{y}$$\\hat{x}_i - \\bar{\\hat{x}}$$(y_i - \\bar{y})(\\hat{x}_i - \\bar{\\hat{x}})$$(\\hat{x}_i - \\bar{\\hat{x}})^2$
1-2-121
22121
30000
44284
5-4-284
合計002010

Step 6: 2SLS推定量の計算

構造パラメータの推定:

$\\hat{\\beta}_1^{2SLS} = \\frac{\\sum(y_i - \\bar{y})(\\hat{x}_i - \\bar{\\hat{x}})}{\\sum(\\hat{x}_i - \\bar{\\hat{x}})^2} = \\frac{20}{10} = 2.0$
$\\hat{\\beta}_0^{2SLS} = \\bar{y} - \\hat{\\beta}_1^{2SLS} \\bar{\\hat{x}} = 10 - 2.0 \\times 4 = 2.0$

Step 7: 結果の検証

操作変数推定量(Wald推定量)による確認:

$\\hat{\\beta}_1^{IV} = \\frac{\\text{Cov}(z_i, y_i)}{\\text{Cov}(z_i, x_i)}$

共分散の計算:

  • $\\text{Cov}(z_i, y_i) = \\frac{1}{n-1}\\sum(z_i - \\bar{z})(y_i - \\bar{y})$
  • $(z_i - \\bar{z})(y_i - \\bar{y})$の計算:$(-1)(-2) + (1)(2) + (0)(0) + (2)(4) + (-2)(-4) = 2 + 2 + 0 + 8 + 8 = 20$
  • $\\text{Cov}(z_i, y_i) = \\frac{20}{4} = 5$
  • $\\text{Cov}(z_i, x_i) = \\frac{10}{4} = 2.5$
$\\hat{\\beta}_1^{IV} = \\frac{5}{2.5} = 2.0$

両方の方法で同じ結果が得られました。

計算結果のまとめ

推定量解釈
$\\hat{\\beta}_1^{2SLS}$2処置効果の2SLS推定値
$\\hat{\\beta}_0^{2SLS}$3.32切片の2SLS推定値
第1段階F統計量高い操作変数の強さ

Step 8: 2SLS推定量の統計的性質

一致性:

操作変数条件が満たされれば:

$\\text{plim} \\, \\hat{\\beta}_1^{2SLS} = \\beta_1$

漸近分布:

$\\sqrt{n}(\\hat{\\beta}_1^{2SLS} - \\beta_1) \\xrightarrow{d} N(0, \\sigma^2_{2SLS})$

Step 9: OLSとの比較

OLS推定量:

$\\hat{\\beta}_1^{OLS} = \\frac{\\sum(x_i - \\bar{x})(y_i - \\bar{y})}{\\sum(x_i - \\bar{x})^2}$

$(x_i - \\bar{x})(y_i - \\bar{y})$の計算:$(-1)(-2) + (1)(2) + (0)(0) + (2)(4) + (-2)(-4) = 20$

$\\hat{\\beta}_1^{OLS} = \\frac{20}{10} = 2.0$

この例では内生性がそれほど深刻でないため、OLSと2SLSの結果が近くなっています。

2SLSの実用的考慮事項

  • 弱操作変数:第1段階のF統計量 > 10が目安
  • 過剰識別:複数の操作変数がある場合の検定
  • 標準誤差:2SLS専用の標準誤差を使用
  • 内生性検定:Wu-Hausman検定による確認

経済学・社会科学での応用例

  • 教育の収益率:義務教育年限変更を操作変数として使用
  • 労働供給:税制改正を操作変数として使用
  • 政策効果:自然実験や制度変更を活用
  • 価格弾力性:供給側ショックを操作変数として使用
問題 1/10
カテゴリ一覧に戻る
問題検索