この問題では、ブートストラップ法の基本原理と統計的推論について理解を深めます。ブートストラップ法は、Efron (1979) により開発された革新的な統計手法で、複雑な統計量の分布を経験的に推定し、信頼区間や仮説検定において強力なツールとして活用されています。
ブートストラップ法:データからデータへの再生術
ブートストラップ法(Bootstrap Method)は、観測データから復元抽出により大量の「疑似標本」を生成し、統計量の標本分布を近似する手法です。「自分のブーツストラップを引っ張って自分を持ち上げる」という慣用句に由来し、データ自身から推論の基盤を構築する画期的アイデアです。
Step 1: ブートストラップ法の数学的基礎
元の標本$\mathbf{x} = \{x_1, x_2, \ldots, x_n\}$から経験分布$\hat{F}_n$を構築:
$\hat{F}_n(x) = \frac{1}{n} \sum_{i=1}^n \mathbf{1}\{x_i \leq x\}$
ブートストラップサンプル:$\hat{F}_n$から復元抽出により得られる疑似標本
$\mathbf{x}^* = \{x_1^*, x_2^*, \ldots, x_n^*\} \sim \hat{F}_n$
ブートストラップの基本原理
- Plug-in原理:真の分布$F$を経験分布$\hat{F}_n$で代替
- Monte Carlo近似:多数のブートストラップサンプルによる分布近似
- 無母数性:分布の形状に依存しない汎用的手法
- 計算集約的:理論的困難を計算力で解決
Step 2: 具体的データでの全列挙
元のデータ: $x_1 = 2, x_2 = 4, x_3 = 6$
元の標本平均: $\bar{x} = \frac{2 + 4 + 6}{3} = \frac{12}{3} = 4.0$
ブートストラップサンプルの生成:
復元抽出により$(x_i^*, x_j^*, x_k^*)$の形で$3^3 = 27$通りの組み合わせが可能
Step 3: 全ブートストラップサンプルの列挙
各サンプルの標本平均を系統的に計算:
全27通りのブートストラップサンプル
| サンプル | 平均 | ≥4.0? | サンプル | 平均 | ≥4.0? | サンプル | 平均 | ≥4.0? |
|---|
| (2,2,2) | 2.0 | ✗ | (4,2,2) | 2.67 | ✗ | (6,2,2) | 3.33 | ✗ |
| (2,2,4) | 2.67 | ✗ | (4,2,4) | 3.33 | ✗ | (6,2,4) | 4.0 | ✓ |
| (2,2,6) | 3.33 | ✗ | (4,2,6) | 4.0 | ✓ | (6,2,6) | 4.67 | ✓ |
| (2,4,2) | 2.67 | ✗ | (4,4,2) | 3.33 | ✗ | (6,4,2) | 4.0 | ✓ |
| (2,4,4) | 3.33 | ✗ | (4,4,4) | 4.0 | ✓ | (6,4,4) | 4.67 | ✓ |
| (2,4,6) | 4.0 | ✓ | (4,4,6) | 4.67 | ✓ | (6,4,6) | 5.33 | ✓ |
| (2,6,2) | 3.33 | ✗ | (4,6,2) | 4.0 | ✓ | (6,6,2) | 4.67 | ✓ |
| (2,6,4) | 4.0 | ✓ | (4,6,4) | 4.67 | ✓ | (6,6,4) | 5.33 | ✓ |
| (2,6,6) | 4.67 | ✓ | (4,6,6) | 5.33 | ✓ | (6,6,6) | 6.0 | ✓ |
Step 4: 条件を満たすサンプルの計数
標本平均が4.0以上となるサンプル:
- (6,2,4): 平均 = 4.0
- (4,2,6): 平均 = 4.0
- (6,2,6): 平均 = 4.67
- (6,4,2): 平均 = 4.0
- (4,4,4): 平均 = 4.0
- (6,4,4): 平均 = 4.67
- (2,4,6): 平均 = 4.0
- (4,4,6): 平均 = 4.67
- (6,4,6): 平均 = 5.33
- (4,6,2): 平均 = 4.0
- (6,6,2): 平均 = 4.67
- (2,6,4): 平均 = 4.0
- (4,6,4): 平均 = 4.67
- (6,6,4): 平均 = 5.33
- (2,6,6): 平均 = 4.67
- (4,6,6): 平均 = 5.33
- (6,6,6): 平均 = 6.0
合計:14個
Step 5: 確率の計算
$P(\bar{X}^* \geq 4.0) = \frac{17}{27} = 0.63 \approx 0.629629$
ブートストラップ分布の理論的性質
Step 6: ブートストラップ統計量の分布
ブートストラップ標本平均の分布:
$\bar{X}^* = \frac{1}{3}(X_1^* + X_2^* + X_3^*)$
各$X_i^*$は独立に$\{2, 4, 6\}$から等確率$\frac{1}{3}$で選択される離散分布に従います。
分布の詳細分析:
ブートストラップ標本平均の分布
| 標本平均 | 出現回数 | 確率 | 累積確率 |
|---|
| 2.0 | 1 | 1/27 | 1/27 |
| 2.67 | 3 | 3/27 | 4/27 |
| 3.33 | 6 | 6/27 | 10/27 |
| 4.0 | 7 | 7/27 | 17/27 |
| 4.67 | 6 | 6/27 | 23/27 |
| 5.33 | 3 | 3/27 | 26/27 |
| 6.0 | 1 | 1/27 | 27/27 |