非線形回帰の線形化による推定
非線形回帰モデルは、そのまま線形回帰の手法を適用できないため、適切な変換により線形化して推定を行います。
指数成長モデルの線形化
指数成長モデル:
$y = ae^{bx}$
両辺の自然対数を取ると:
$\ln y = \ln a + bx$
$Y = \ln y$、$\beta_0 = \ln a$、$\beta_1 = b$ とおくと:
$Y = \beta_0 + \beta_1 x$
これは線形回帰モデルになります。
Step 1: データの対数変換
与えられたデータを対数変換:
- $(x_1, y_1) = (0, 2) \Rightarrow (x_1, Y_1) = (0, \ln 2) = (0, 0.693)$
- $(x_2, y_2) = (1, 6) \Rightarrow (x_2, Y_2) = (1, \ln 6) = (1, 1.792)$
- $(x_3, y_3) = (2, 18) \Rightarrow (x_3, Y_3) = (2, \ln 18) = (2, 2.890)$
Step 2: 基本統計量の計算
変換後のデータより:
$\bar{x} = \frac{0 + 1 + 2}{3} = 1$
$\bar{Y} = \frac{0.693 + 1.792 + 2.890}{3} = \frac{5.375}{3} = 1.792$
Step 3: 偏差の計算
各データ点の偏差:
- $x_1 - \bar{x} = 0 - 1 = -1$
- $x_2 - \bar{x} = 1 - 1 = 0$
- $x_3 - \bar{x} = 2 - 1 = 1$
- $Y_1 - \bar{Y} = 0.693 - 1.792 = -1.099$
- $Y_2 - \bar{Y} = 1.792 - 1.792 = 0$
- $Y_3 - \bar{Y} = 2.890 - 1.792 = 1.098$
Step 4: 回帰係数の計算
偏差平方和と偏差積和:
$\sum_{i=1}^3 (x_i - \bar{x})^2 = (-1)^2 + 0^2 + 1^2 = 2$
$\sum_{i=1}^3 (x_i - \bar{x})(Y_i - \bar{Y}) = (-1)(-1.099) + (0)(0) + (1)(1.098)$
$= 1.099 + 0 + 1.098 = 2.197$
回帰係数$\beta_1 = b$の推定値:
$\hat{b} = \frac{\sum_{i=1}^3 (x_i - \bar{x})(Y_i - \bar{Y})}{\sum_{i=1}^3 (x_i - \bar{x})^2} = \frac{2.197}{2} = 1.0985$
小数第2位まで:1.10
Step 5: 推定結果の検証
切片の推定値:
$\hat{\beta}_0 = \bar{Y} - \hat{b}\bar{x} = 1.792 - 1.0985 \times 1 = 0.6935$
したがって:$\hat{a} = e^{0.6935} = 2.001 \approx 2$
推定されたモデル:$y = 2e^{1.10x}$
非線形回帰の注意点
- 線形化による誤差構造の変化:元の誤差項の性質が変わる可能性
- 重み付け:対数変換により分散が不均一になる場合がある
- モデル選択:線形化が適切でない場合は非線形最小二乗法を検討
- 残差診断:変換後のデータでの残差分析が重要
Step 6: 推定値の妥当性
元のデータでの予測値:
- $x = 0$: $\hat{y} = 2e^{1.10 \times 0} = 2 \times 1 = 2$ ✓
- $x = 1$: $\hat{y} = 2e^{1.10 \times 1} = 2 \times 3.004 = 6.008 \approx 6$ ✓
- $x = 2$: $\hat{y} = 2e^{1.10 \times 2} = 2 \times 9.025 = 18.05 \approx 18$ ✓
推定されたモデルは元のデータを良く説明しています。