Tukeyの箱ひげ図における外れ値検出法
John Tukeyが提案した1.5×IQRルールは、データの外れ値を客観的に特定する広く使われている手法です。箱ひげ図(Box Plot)の理論的基盤であり、探索的データ分析(EDA)の核心技術です。
IQR(四分位範囲)の計算
$IQR = Q_3 - Q_1$ (第3四分位点 - 第1四分位点)
今回の例:
$IQR = 35 - 25 = 10$
外れ値境界の決定
Tukeyルールによる境界設定:
上限フェンス:$Q_3 + 1.5 \times IQR$
下限フェンス:$Q_1 - 1.5 \times IQR$
計算過程
| 境界 | 計算式 | 計算 | 結果 |
|---|
| 上限 | Q₃ + 1.5×IQR | 35 + 1.5×10 | 50.00 |
| 下限 | Q₁ - 1.5×IQR | 25 - 1.5×10 | 10.00 |
外れ値の分類
- 軽度の外れ値:1.5×IQR ~ 3×IQR 範囲外
- 極度の外れ値:3×IQR範囲外