回帰分析編

単回帰分析、回帰係数の推定と検定、予測と信頼区間、実験計画の基礎に関する問題

多重共線性レベル3

重回帰分析において多重共線性が存在する場合に生じる問題として、誤っているものはどれか。

解説

解答と解説を表示

重回帰分析における多重共線性の問題に関する問題です。

1. 多重共線性の定義

多重共線性（multicollinearity）とは、重回帰分析において説明変数間に強い相関関係がある状態を指します。完全な多重共線性の場合、ある説明変数が他の説明変数の線形結合として表現できます。

2. 多重共線性の影響

多重共線性が存在すると、回帰分析に以下のような影響があります：

1. 回帰係数の推定値が不安定になる：

多重共線性があると、回帰係数の推定値が不安定になり、データの小さな変化に対して大きく変動することがあります。これは、説明変数間の強い相関により、個々の変数の独自の効果を分離することが難しくなるためです。

2. 回帰係数の標準誤差が大きくなる：

多重共線性は回帰係数の標準誤差を増大させます。これにより、係数の信頼区間が広くなり、係数の推定精度が低下します。

3. 回帰係数の符号が予想と反対になることがある：

多重共線性により、理論的に正の関係があるはずの変数の係数が負になったり、その逆が起こったりすることがあります。これは、他の相関のある変数の影響を調整した後の「純粋な」効果が、予想とは異なる方向を示すことがあるためです。

4. 個々の説明変数の有意性検定の検出力が低下する：

標準誤差が大きくなることで、t値（係数を標準誤差で割った値）が小さくなり、個々の回帰係数の統計的有意性を検出する能力が低下します。つまり、実際には重要な変数であっても、統計的に有意でないと判断されることがあります。

3. 多重共線性とモデル全体の当てはまり

多重共線性は、個々の回帰係数の推定と解釈に問題を引き起こしますが、モデル全体の予測能力や当てはまりの良さ（決定係数R²）には必ずしも悪影響を与えません。

実際、多重共線性があっても、モデル全体の決定係数（R²）は高いままであることが多いです。これは、相関のある説明変数のグループ全体としては、応答変数の変動をよく説明できるためです。

したがって、「モデル全体の決定係数（R²）が低くなる」という記述は誤りです。

4. 多重共線性の診断と対処法

多重共線性の診断方法：

多重共線性への対処法：

多重共線性に関する誤解：

多重共線性は、回帰分析の仮定に違反するものではなく、推定の問題を引き起こすものです。多重共線性があっても、回帰モデルは不偏推定量を提供しますが、その精度（効率性）が低下します。

また、予測が主な目的である場合、多重共線性は必ずしも深刻な問題ではありません。しかし、個々の説明変数の効果を解釈することが目的である場合は、多重共線性に注意する必要があります。

したがって、重回帰分析において多重共線性が存在する場合に生じる問題として誤っているものは「モデル全体の決定係数（R²）が低くなる」です。

問題検索