確率と確率分布

事象と確率、確率分布の特性値、変数変換、大数の法則、中心極限定理など統計検定準1級レベルの確率論を学習します。

ブートストラップ法と信頼区間 レベル1

データ$x_1 = 2, x_2 = 4, x_3 = 6$に対してブートストラップ法を適用する。復元抽出で3つの値を選ぶ全ての可能なブートストラップサンプルのうち、標本平均が元のデータの標本平均4.0以上となるサンプル数の割合を求めよ。小数第3位まで求めよ。

解説
解答と解説を表示
<p>この問題では、<strong>ブートストラップ法の基本原理と統計的推論</strong>について理解を深めます。ブートストラップ法は、Efron (1979) により開発された革新的な統計手法で、複雑な統計量の分布を経験的に推定し、信頼区間や仮説検定において強力なツールとして活用されています。</p><h4>ブートストラップ法:データからデータへの再生術</h4><p>ブートストラップ法(Bootstrap Method)は、観測データから復元抽出により大量の「疑似標本」を生成し、統計量の標本分布を近似する手法です。「自分のブーツストラップを引っ張って自分を持ち上げる」という慣用句に由来し、データ自身から推論の基盤を構築する画期的アイデアです。</p><p class='step'><strong>Step 1: ブートストラップ法の数学的基礎</strong></p><p>元の標本$\mathbf{x} = \{x_1, x_2, \ldots, x_n\}$から経験分布$\hat{F}_n$を構築:</p><div class='formula'>$\hat{F}_n(x) = \frac{1}{n} \sum_{i=1}^n \mathbf{1}\{x_i \leq x\}$

ブートストラップサンプル:$\hat{F}_n$から復元抽出により得られる疑似標本

$\mathbf{x}^* = \{x_1^*, x_2^*, \ldots, x_n^*\} \sim \hat{F}_n$
ブートストラップの基本原理
  • Plug-in原理:真の分布$F$を経験分布$\hat{F}_n$で代替
  • Monte Carlo近似:多数のブートストラップサンプルによる分布近似
  • 無母数性:分布の形状に依存しない汎用的手法
  • 計算集約的:理論的困難を計算力で解決

Step 2: 具体的データでの全列挙

元のデータ: $x_1 = 2, x_2 = 4, x_3 = 6$

元の標本平均: $\bar{x} = \frac{2 + 4 + 6}{3} = \frac{12}{3} = 4.0$

ブートストラップサンプルの生成:

復元抽出により$(x_i^*, x_j^*, x_k^*)$の形で$3^3 = 27$通りの組み合わせが可能

Step 3: 全ブートストラップサンプルの列挙

各サンプルの標本平均を系統的に計算:

全27通りのブートストラップサンプル
サンプル平均≥4.0?サンプル平均≥4.0?サンプル平均≥4.0?
(2,2,2)2.0(4,2,2)2.67(6,2,2)3.33
(2,2,4)2.67(4,2,4)3.33(6,2,4)4.0
(2,2,6)3.33(4,2,6)4.0(6,2,6)4.67
(2,4,2)2.67(4,4,2)3.33(6,4,2)4.0
(2,4,4)3.33(4,4,4)4.0(6,4,4)4.67
(2,4,6)4.0(4,4,6)4.67(6,4,6)5.33
(2,6,2)3.33(4,6,2)4.0(6,6,2)4.67
(2,6,4)4.0(4,6,4)4.67(6,6,4)5.33
(2,6,6)4.67(4,6,6)5.33(6,6,6)6.0

Step 4: 条件を満たすサンプルの計数

標本平均が4.0以上となるサンプル:

  1. (6,2,4): 平均 = 4.0
  2. (4,2,6): 平均 = 4.0
  3. (6,2,6): 平均 = 4.67
  4. (6,4,2): 平均 = 4.0
  5. (4,4,4): 平均 = 4.0
  6. (6,4,4): 平均 = 4.67
  7. (2,4,6): 平均 = 4.0
  8. (4,4,6): 平均 = 4.67
  9. (6,4,6): 平均 = 5.33
  10. (4,6,2): 平均 = 4.0
  11. (6,6,2): 平均 = 4.67
  12. (2,6,4): 平均 = 4.0
  13. (4,6,4): 平均 = 4.67
  14. (6,6,4): 平均 = 5.33
  15. (2,6,6): 平均 = 4.67
  16. (4,6,6): 平均 = 5.33
  17. (6,6,6): 平均 = 6.0

合計:14個

Step 5: 確率の計算

$P(\bar{X}^* \geq 4.0) = \frac{17}{27} = 0.63 \approx 0.629629$

ブートストラップ分布の理論的性質

Step 6: ブートストラップ統計量の分布

ブートストラップ標本平均の分布:

$\bar{X}^* = \frac{1}{3}(X_1^* + X_2^* + X_3^*)$

各$X_i^*$は独立に$\{2, 4, 6\}$から等確率$\frac{1}{3}$で選択される離散分布に従います。</p><p><strong>分布の詳細分析:</strong></p><div class='key-point'><div class='key-point-title'>ブートストラップ標本平均の分布</div><table style='width:100%; border-collapse: collapse; margin: 1em 0;'><tr style='background-color: #f5f5f5;'><th style='border: 1px solid #ddd; padding: 8px;'>標本平均</th><th style='border: 1px solid #ddd; padding: 8px;'>出現回数</th><th style='border: 1px solid #ddd; padding: 8px;'>確率</th><th style='border: 1px solid #ddd; padding: 8px;'>累積確率</th></tr><tr><td style='border: 1px solid #ddd; padding: 8px;'>2.0</td><td style='border: 1px solid #ddd; padding: 8px;'>1</td><td style='border: 1px solid #ddd; padding: 8px;'>1/27</td><td style='border: 1px solid #ddd; padding: 8px;'>1/27</td></tr><tr><td style='border: 1px solid #ddd; padding: 8px;'>2.67</td><td style='border: 1px solid #ddd; padding: 8px;'>3</td><td style='border: 1px solid #ddd; padding: 8px;'>3/27</td><td style='border: 1px solid #ddd; padding: 8px;'>4/27</td></tr><tr><td style='border: 1px solid #ddd; padding: 8px;'>3.33</td><td style='border: 1px solid #ddd; padding: 8px;'>6</td><td style='border: 1px solid #ddd; padding: 8px;'>6/27</td><td style='border: 1px solid #ddd; padding: 8px;'>10/27</td></tr><tr><td style='border: 1px solid #ddd; padding: 8px;'>4.0</td><td style='border: 1px solid #ddd; padding: 8px;'>7</td><td style='border: 1px solid #ddd; padding: 8px;'>7/27</td><td style='border: 1px solid #ddd; padding: 8px;'>17/27</td></tr><tr><td style='border: 1px solid #ddd; padding: 8px;'>4.67</td><td style='border: 1px solid #ddd; padding: 8px;'>6</td><td style='border: 1px solid #ddd; padding: 8px;'>6/27</td><td style='border: 1px solid #ddd; padding: 8px;'>23/27</td></tr><tr><td style='border: 1px solid #ddd; padding: 8px;'>5.33</td><td style='border: 1px solid #ddd; padding: 8px;'>3</td><td style='border: 1px solid #ddd; padding: 8px;'>3/27</td><td style='border: 1px solid #ddd; padding: 8px;'>26/27</td></tr><tr><td style='border: 1px solid #ddd; padding: 8px;'>6.0</td><td style='border: 1px solid #ddd; padding: 8px;'>1</td><td style='border: 1px solid #ddd; padding: 8px;'>1/27</td><td style='border: 1px solid #ddd; padding: 8px;'>27/27</td></tr></table>

問題 1/10
カテゴリ一覧に戻る