非線形回帰の線形化による推定
非線形回帰モデルは、そのまま線形回帰の手法を適用できないため、適切な変換により線形化して推定を行います。
指数成長モデルの線形化
指数成長モデル:
$$y = ae^{bx}$$
両辺の自然対数を取ると:
$$\\ln y = \\ln a + bx$$
$Y = \\ln y$、$\\beta_0 = \\ln a$、$\\beta_1 = b$ とおくと:
$$Y = \\beta_0 + \\beta_1 x$$
これは線形回帰モデルになります。
Step 1: データの対数変換
与えられたデータを対数変換:
- $(x_1, y_1) = (0, 2) \\Rightarrow (x_1, Y_1) = (0, \\ln 2) = (0, 0.693)$
- $(x_2, y_2) = (1, 6) \\Rightarrow (x_2, Y_2) = (1, \\ln 6) = (1, 1.792)$
- $(x_3, y_3) = (2, 18) \\Rightarrow (x_3, Y_3) = (2, \\ln 18) = (2, 2.890)$
Step 2: 基本統計量の計算
変換後のデータより:
$$\\bar{x} = \\frac{0 + 1 + 2}{3} = 1$$
$$\\bar{Y} = \\frac{0.693 + 1.792 + 2.890}{3} = \\frac{5.375}{3} = 1.792$$
Step 3: 偏差の計算
各データ点の偏差:
- $x_1 - \\bar{x} = 0 - 1 = -1$
- $x_2 - \\bar{x} = 1 - 1 = 0$
- $x_3 - \\bar{x} = 2 - 1 = 1$
- $Y_1 - \\bar{Y} = 0.693 - 1.792 = -1.099$
- $Y_2 - \\bar{Y} = 1.792 - 1.792 = 0$
- $Y_3 - \\bar{Y} = 2.890 - 1.792 = 1.098$
Step 4: 回帰係数の計算
偏差平方和と偏差積和:
$$\\sum_{i=1}^3 (x_i - \\bar{x})^2 = (-1)^2 + 0^2 + 1^2 = 2$$
$$\\sum_{i=1}^3 (x_i - \\bar{x})(Y_i - \\bar{Y}) = (-1)(-1.099) + (0)(0) + (1)(1.098)$$
$$= 1.099 + 0 + 1.098 = 2.197$$
回帰係数$\\beta_1 = b$の推定値:
$$\\hat{b} = \\frac{\\sum_{i=1}^3 (x_i - \\bar{x})(Y_i - \\bar{Y})}{\\sum_{i=1}^3 (x_i - \\bar{x})^2} = \\frac{2.197}{2} = 1.0985$$
小数第2位まで:1.10
Step 5: 推定結果の検証
切片の推定値:
$$\\hat{\\beta}_0 = \\bar{Y} - \\hat{b}\\bar{x} = 1.792 - 1.0985 \\times 1 = 0.6935$$
したがって:$\\hat{a} = e^{0.6935} = 2.001 \\approx 2$
推定されたモデル:$y = 2e^{1.10x}$
非線形回帰の注意点
- 線形化による誤差構造の変化:元の誤差項の性質が変わる可能性
- 重み付け:対数変換により分散が不均一になる場合がある
- モデル選択:線形化が適切でない場合は非線形最小二乗法を検討
- 残差診断:変換後のデータでの残差分析が重要
Step 6: 推定値の妥当性
元のデータでの予測値:
- $x = 0$: $\\hat{y} = 2e^{1.10 \\times 0} = 2 \\times 1 = 2$ ✓
- $x = 1$: $\\hat{y} = 2e^{1.10 \\times 1} = 2 \\times 3.004 = 6.008 \\approx 6$ ✓
- $x = 2$: $\\hat{y} = 2e^{1.10 \\times 2} = 2 \\times 9.025 = 18.05 \\approx 18$ ✓
推定されたモデルは元のデータを良く説明しています。