回帰分析編

回帰分析の基礎や評価指標についての知識を確認します

残差分析 レベル1

回帰分析における残差プロットの解釈として正しいものはどれか。

解説
解答と解説を表示
<p>回帰分析における残差プロットの解釈に関する問題です。</p><p class='step'>1. 残差と残差プロットの基本</p> <p>回帰分析における残差 $e_i$ は、観測値 $y_i$ と予測値 $\hat{y}_i$ の差として定義されます:</p> <p class='formula'>$e_i = y_i - \hat{y}_i
lt;/p><p>残差プロットは、通常、横軸に予測値 $\hat{y}_i$ または説明変数 $x_i$、縦軸に残差 $e_i$ をプロットしたグラフです。残差プロットは、回帰モデルの仮定が満たされているかどうかを視覚的に確認するために用いられます。</p><p class='step'>2. 回帰分析の主な仮定</p> <p>線形回帰分析には、以下のような主要な仮定があります:</p> <ul> <li>線形性:説明変数と応答変数の間には線形関係がある</li> <li>独立性:誤差項は互いに独立している</li> <li>等分散性(均一分散性):誤差項の分散は説明変数の値に関わらず一定である</li> <li>正規性:誤差項は正規分布に従う</li> </ul><p class='step'>3. 残差プロットのパターンと解釈</p> <p>残差プロットに現れる様々なパターンは、モデルの仮定が満たされているかどうかの手がかりを提供します:</p><p><strong>パターンがない(ランダムに散らばっている)場合</strong>:</p> <p>残差がランダムに散らばっており、特定のパターンが見られない場合、モデルの仮定が満たされている可能性が高いです。これは良い兆候です。</p><p><strong>曲線的なパターンがある場合</strong>:</p> <p>残差プロットに曲線的なパターン(例えば、U字型やS字型)が見られる場合、線形性の仮定が満たされていない可能性があります。これは、説明変数と応答変数の間の関係が線形ではなく、非線形であることを示唆しています。この場合、説明変数の変換(例えば、二乗項や対数変換の追加)や非線形モデルの使用を検討する必要があります。</p><p><strong>漏斗状のパターンがある場合</strong>:</p> <p>残差プロットに漏斗状のパターン(残差の散らばりが説明変数の値によって変化する)が見られる場合、等分散性の仮定が満たされていない可能性があります。これは、誤差項の分散が説明変数の値に依存していることを示唆しています。この場合、応答変数の変換(例えば、対数変換)や加重最小二乗法の使用を検討する必要があります。</p><p class='step'>4. 選択肢の検討</p> <p>各選択肢について検討します:</p><ol> <li>「残差が正規分布に従うことを示すためには、残差の絶対値を用いるべきである」:誤りです。残差の正規性を確認するためには、残差そのものを用いるべきであり、絶対値を取ると分布の形状が変わってしまいます。正規性の確認には、残差のヒストグラムやQ-Qプロットが用いられます。</li><li>「残差プロットにパターンがない場合、モデルの仮定が満たされていない可能性が高い」:誤りです。残差プロットにパターンがなく、ランダムに散らばっている場合は、モデルの仮定が満たされている可能性が高いです。</li><li>「残差プロットに漏斗状のパターンがある場合、等分散性の仮定が満たされている」:誤りです。漏斗状のパターンは、等分散性の仮定が満たされていないことを示唆します。</li><li>「残差プロットに曲線的なパターンがある場合、線形性の仮定が満たされていない可能性がある」:正しいです。曲線的なパターンは、説明変数と応答変数の間の関係が線形ではないことを示唆しています。</li><li>「残差の大きさは説明変数の値に依存すべきである」:誤りです。等分散性の仮定によれば、残差の大きさ(分散)は説明変数の値に依存すべきではありません。</li> </ol><p class='note'>残差分析の重要性と追加の診断ツール:</p> <ul> <li>残差分析は、モデルの適切さを評価し、モデルの改善点を特定するために重要です。</li> <li>標準化残差や学生化残差を用いると、外れ値の検出が容易になります。</li> <li>レバレッジやクックの距離などの指標は、影響力の大きい観測値(影響点)を特定するのに役立ちます。</li> <li>残差の自己相関を確認するためには、ダービン・ワトソン検定やダーバン検定が用いられます。</li> <li>多重共線性(説明変数間の強い相関)を検出するためには、分散拡大要因(VIF)が用いられます。</li> </ul><p>したがって、正しい選択肢は「残差プロットに曲線的なパターンがある場合、線形性の仮定が満たされていない可能性がある」です。</p>
問題 1/10
カテゴリ一覧に戻る