ジャックナイフ推定量の理論
ジャックナイフ推定量は、標本から1つずつ観測値を除いた部分標本を用いて偏りを減らす推定法です。
ジャックナイフ推定量の定義
Step 1: 部分標本の定義
標本$X_1, X_2, \ldots, X_n$に対して、$i$番目の観測値を除いた部分標本:
$X_{(i)} = \{X_1, \ldots, X_{i-1}, X_{i+1}, \ldots, X_n\}$
部分標本の大きさは$n-1$です。
Step 2: 部分標本統計量
各部分標本に対する統計量$T_{(i)}$を定義:
$T_{(i)} = T(X_{(i)})$
ここで$T(\cdot)$は統計量を表す関数です。
Step 3: ジャックナイフ推定量
ジャックナイフ推定量$\hat{\theta}_J$は:
$\hat{\theta}_J = n \cdot T(X_1, \ldots, X_n) - (n-1) \cdot \frac{1}{n}\sum_{i=1}^n T_{(i)}$
または等価に:
$\hat{\theta}_J = n \cdot \hat{\theta} - (n-1) \cdot \overline{T_{(\cdot)}}$
ここで$\overline{T_{(\cdot)}} = \frac{1}{n}\sum_{i=1}^n T_{(i)}$です。
標本平均のジャックナイフ推定
Step 4: 与えられたデータ
標本:$X_1 = 1, X_2 = 3, X_3 = 5, X_4 = 7$
標本サイズ:$n = 4$
全標本平均:$\bar{X} = \frac{1 + 3 + 5 + 7}{4} = \frac{16}{4} = 4$
Step 5: 部分標本平均の計算
各部分標本の平均を計算:
- $X_{(1)} = \{3, 5, 7\}$:$\bar{X}_{(1)} = \frac{3 + 5 + 7}{3} = \frac{15}{3} = 5$
- $X_{(2)} = \{1, 5, 7\}$:$\bar{X}_{(2)} = \frac{1 + 5 + 7}{3} = \frac{13}{3} = 4.333...$
- $X_{(3)} = \{1, 3, 7\}$:$\bar{X}_{(3)} = \frac{1 + 3 + 7}{3} = \frac{11}{3} = 3.666...$
- $X_{(4)} = \{1, 3, 5\}$:$\bar{X}_{(4)} = \frac{1 + 3 + 5}{3} = \frac{9}{3} = 3$
Step 6: 部分標本平均の平均
$\overline{\bar{X}_{(\cdot)}} = \frac{1}{4}(5 + 4.333... + 3.666... + 3) = \frac{1}{4} \cdot 16 = 4$
Step 7: ジャックナイフ推定量の計算
標本平均のジャックナイフ推定量:
$\hat{\mu}_J = n \cdot \bar{X} - (n-1) \cdot \overline{\bar{X}_{(\cdot)}}$
$= 4 \times 4 - 3 \times 4 = 16 - 12 = 4$
ジャックナイフ推定量の性質
Step 8: 標本平均の特殊性
標本平均の場合、興味深い性質があります:
$\bar{X}_{(i)} = \frac{1}{n-1}\sum_{j \neq i} X_j = \frac{n\bar{X} - X_i}{n-1}$
したがって:
$\overline{\bar{X}_{(\cdot)}} = \frac{1}{n}\sum_{i=1}^n \frac{n\bar{X} - X_i}{n-1} = \frac{1}{n-1}\left(n\bar{X} - \bar{X}\right) = \bar{X}$
Step 9: 標本平均のジャックナイフ不変性
標本平均のジャックナイフ推定量は元の標本平均と一致:
$\hat{\mu}_J = n \cdot \bar{X} - (n-1) \cdot \bar{X} = \bar{X}$
これは標本平均が既に不偏推定量であることを反映しています。
ジャックナイフ推定量の重要性
- 偏りの減少:$O(n^{-1})$の偏りを$O(n^{-2})$に改善
- 分散推定:非パラメトリックな分散推定が可能
- 信頼区間:複雑な統計量の区間推定に有用
- 汎用性:多様な統計量に適用可能
ジャックナイフ分散推定
Step 10: ジャックナイフ分散推定量
推定量の分散のジャックナイフ推定:
$\text{Var}_J(\hat{\theta}) = \frac{n-1}{n}\sum_{i=1}^n \left(T_{(i)} - \overline{T_{(\cdot)}}\right)^2$
標本平均の場合:
$\text{Var}_J(\bar{X}) = \frac{n-1}{n}\sum_{i=1}^n \left(\bar{X}_{(i)} - \bar{X}\right)^2$
Step 11: 具体的な分散計算
部分標本平均の偏差:
- $\bar{X}_{(1)} - \bar{X} = 5 - 4 = 1$
- $\bar{X}_{(2)} - \bar{X} = 4.333... - 4 = 0.333...$
- $\bar{X}_{(3)} - \bar{X} = 3.666... - 4 = -0.333...$
- $\bar{X}_{(4)} - \bar{X} = 3 - 4 = -1$
偏差二乗和:
$\sum_{i=1}^4 (\bar{X}_{(i)} - \bar{X})^2 = 1^2 + (1/3)^2 + (-1/3)^2 + (-1)^2 = 1 + \frac{1}{9} + \frac{1}{9} + 1 = 2 + \frac{2}{9} = \frac{20}{9}$
ジャックナイフ分散推定量:
$\text{Var}_J(\bar{X}) = \frac{3}{4} \times \frac{20}{9} = \frac{60}{36} = \frac{5}{3}$
他の統計量でのジャックナイフ
Step 12: 標本分散のジャックナイフ
標本分散$S^2 = \frac{1}{n-1}\sum_{i=1}^n (X_i - \bar{X})^2$の場合:
$S^2 = \frac{1}{3}[(1-4)^2 + (3-4)^2 + (5-4)^2 + (7-4)^2] = \frac{1}{3}[9 + 1 + 1 + 9] = \frac{20}{3}$
各部分標本の分散:
- $S^2_{(1)} = \frac{1}{2}[(3-5)^2 + (5-5)^2 + (7-5)^2] = \frac{1}{2}[4 + 0 + 4] = 4$
- $S^2_{(2)} = \frac{1}{2}[(1-4.333...)^2 + (5-4.333...)^2 + (7-4.333...)^2] = \frac{28}{3}$
- $S^2_{(3)} = \frac{1}{2}[(1-3.666...)^2 + (3-3.666...)^2 + (7-3.666...)^2] = \frac{28}{3}$
- $S^2_{(4)} = \frac{1}{2}[(1-3)^2 + (3-3)^2 + (5-3)^2] = \frac{1}{2}[4 + 0 + 4] = 4$
ジャックナイフ分散推定量:
$\hat{\sigma^2}_J = 4 \times \frac{20}{3} - 3 \times \frac{1}{4}\left(4 + \frac{28}{3} + \frac{28}{3} + 4\right) = \frac{20}{3}$
この場合も元の推定量と一致します。