実験計画法

分散分析、因子実験、乱塊法、直交表など統計検定準1級レベルの実験計画法を学習します。

タイトルをここに レベル1

問題はここに

解説
解答と解説を表示

実験計画の仮定診断と残差分析

分散分析の結果を信頼するためには、その前提条件(正規性、等分散性、独立性)が満たされていることを確認する必要があります。残差分析は、これらの仮定を診断する最も重要な手法です。

残差分析の重要性

仮定の検証:統計手法の前提条件が満たされているかを確認します。問題の発見:外れ値、非線形性、不等分散性などの問題を特定できます。

Step 1: 標準化残差の整理

標準化残差最大絶対値
A-1.2, 0.8, -0.5, 1.1, -0.21.2
B0.9, -1.8, 1.3, -0.7, 0.31.8
C-0.4, 1.5, -1.1, 0.6, -0.61.5

Step 2: 全データから最大絶対値を特定

全ての標準化残差:

-1.2, 0.8, -0.5, 1.1, -0.2, 0.9, -1.8, 1.3, -0.7, 0.3, -0.4, 1.5, -1.1, 0.6, -0.6

各値の絶対値:

1.2, 0.8, 0.5, 1.1, 0.2, 0.9, 1.8, 1.3, 0.7, 0.3, 0.4, 1.5, 1.1, 0.6, 0.6

$$\max|標準化残差| = 1.8$$

小数第1位まで:1.8

Step 3: 標準化残差の解釈基準

標準化残差の判定基準

絶対値判定対処
< 2.0正常問題なし
2.0 - 2.5やや大きい注意深く検討
2.5 - 3.0大きい外れ値の可能性
> 3.0非常に大きい外れ値として処理

本例の判定:最大値1.8 < 2.0 → 正常範囲

Step 4: 残差分析の包括的診断

1. 正規性の診断

  • Q-Qプロット:残差が正規分布に従うかを視覚的に確認
  • Shapiro-Wilk検定:残差の正規性を統計的に検定
  • ヒストグラム:残差の分布形状を確認

2. 等分散性の診断

  • 残差vs予測値プロット:ランダムなパターンであることを確認
  • 群別残差の散布度:各群の残差の分散が等しいか
  • Levene検定:等分散性の統計的検定

3. 独立性の診断

  • 残差の系列相関:時系列データでの自己相関
  • ランダム化の確認:実験設計の妥当性
  • 空間相関:位置に依存した相関

Step 5: 群別残差の詳細分析

平均残差残差の分散残差の範囲診断
A0.000.611.3正常
B0.001.053.1やや分散大
C0.000.682.6正常

分散比の確認:最大/最小 = 1.05/0.61 = 1.72 < 4 → 等分散性仮定OK

残差分析で発見できる問題

問題症状対処法
外れ値|標準化残差| > 2.5データの再確認、除外検討
非正規性Q-Qプロットの非線形変換、ノンパラメトリック手法
不等分散残差の拡散パターン重み付き回帰、変換
非線形性残差の系統的パターンモデルの修正、多項式項追加

標準化残差の計算方法

Step 6: 標準化残差の理論

標準化残差は以下のように計算されます:

$$r_{standardized} = \frac{残差}{\sqrt{MSE \times (1 - h_{ii})}}$$

ここで:

  • 残差:観測値 - 予測値
  • MSE:平均平方誤差
  • h_{ii}:ハット行列の対角要素(レバレッジ)

一元配置ANOVAでは、各群内でh_{ii} = 1/n(等サイズの場合)

残差の種類と用途

残差の種類特徴用途
生残差e = y - ŷ基本的な偏差
標準化残差r = e/√MSEスケール調整済み
スチューデント化残差レバレッジ考慮外れ値検出
削除残差該当点を除いて計算影響力の評価

診断プロットの作成と解釈

Step 7: 主要な診断プロット

残差プロットの解釈

プロット正常パターン問題のサイン
残差 vs 予測値ランダム散布扇形、曲線パターン
Q-Qプロット直線上に点が並ぶS字カーブ、外れ点
残差ヒストグラム正規分布形状歪み、複数モード
群別箱ひげ図等しい分散と中央値0異なる分散、偏った分布

仮定違反時の対処法

問題別対処戦略

  1. 軽微な違反:分散分析はロバストなため、軽微な違反は許容
  2. 外れ値:原因を調査後、除外または別途分析
  3. 不等分散:Welch's ANOVA、重み付き分析
  4. 非正規性:変換(対数、平方根)、ノンパラメトリック検定
  5. 複合的問題:一般化線形モデル、ブートストラップ

統計ソフトでの残差分析

ソフトウェア別機能

  • SPSS:「プロット」オプションで自動作成
  • Rplot(aov_object)で4種類のプロット
  • SASPROC GLMPLOTSオプション
  • Minitab:「残差プロット」メニュー

Step 8: 実践的な判断基準

診断項目判定本例の状況結論
最大標準化残差< 2.01.8問題なし
分散の等質性比 < 41.72仮定満足
平均残差≈ 00.00適切
極端値の個数5%未満0%問題なし

結果の報告例

論文での報告例:

「分散分析の仮定を検証するため残差分析を実施した。標準化残差の最大絶対値は1.8で、外れ値は検出されなかった。群間の残差分散比は1.72で等分散性が確認され、Q-Qプロットにより正規性も支持された。従って、分散分析の結果は妥当と判断される。」

継続的な診断の重要性

  • 事前診断:実験設計段階での仮定の確認
  • 分析中診断:残差分析による仮定の検証
  • 事後診断:結果の頑健性確認
  • 感度分析:仮定変更時の結果への影響評価
問題 1/10