確率と確率分布

事象と確率、確率分布の特性値、変数変換、大数の法則、中心極限定理など統計検定準1級レベルの確率論を学習します。

順序統計量と極値分布 レベル1

独立同分布$X_1, X_2, \ldots, X_n \sim \text{Uniform}(0, 1)$に従う$n = 5$個の確率変数において、第3順序統計量$X_{(3)}$の確率密度関数$f_{X_{(3)}}(x)$を$x = 0.6$で評価した値を求めよ。ただし、$X_{(1)} \leq X_{(2)} \leq \cdots \leq X_{(5)}$とする。小数第3位まで求めよ。

解説
解答と解説を表示
<p>この問題では、<strong>順序統計量の理論と極値分布の基礎</strong>について理解を深めます。順序統計量は、統計学における基本的概念で、極値理論、分位数推定、ロバスト統計の中核をなし、金融リスク管理や品質管理など幅広い分野で応用されています。</p><h4>順序統計量:データの階層構造を読み解く</h4><p>順序統計量(Order Statistics)は、標本を大きさ順に並べた統計量で、データの分布特性や極値の性質を解析するための基本ツールです。Galton (1885) の中央値研究に端を発し、現代の極値理論や分位数回帰の理論的基盤となっています。</p><p class='step'><strong>Step 1: 順序統計量の数学的定義</strong></p><p>$n$個の独立同分布確率変数$X_1, X_2, \ldots, X_n$を大きさ順に並べた統計量:</p><div class='formula'>$X_{(1)} \leq X_{(2)} \leq \cdots \leq X_{(n)}$

ここで:

  • $X_{(1)} = \min\{X_1, \ldots, X_n\}$:最小順序統計量
  • $X_{(n)} = \max\{X_1, \ldots, X_n\}$:最大順序統計量
  • $X_{(k)}$:第$k$順序統計量($k$番目に小さい値)
順序統計量の基本性質
  • 順序保存性:$X_{(1)} \leq X_{(2)} \leq \cdots \leq X_{(n)}$
  • 非独立性:各順序統計量は互いに従属
  • 分布の変換:元の分布から完全に決定される
  • 極値への収束:$n \to \infty$で特定の極値分布に収束

Step 2: 一般的な順序統計量の確率密度関数

累積分布関数$F(x)$、確率密度関数$f(x)$を持つ分布からの第$k$順序統計量$X_{(k)}$の確率密度関数:

$f_{X_{(k)}}(x) = \frac{n!}{(k-1)!(n-k)!} [F(x)]^{k-1} [1-F(x)]^{n-k} f(x)$

この公式はベータ分布との深い関係を示しており:

$F_{X_{(k)}}(x) = I_{F(x)}(k, n-k+1)$

ここで$I_z(a,b)$は正則化不完全ベータ関数。

Step 3: 一様分布における特殊化

$X_i \sim \text{Uniform}(0, 1)$の場合:

  • $F(x) = x$ ($0 \leq x \leq 1$)
  • $f(x) = 1$ ($0 \leq x \leq 1$)

したがって、第$k$順序統計量の確率密度関数:

$f_{X_{(k)}}(x) = \frac{n!}{(k-1)!(n-k)!} x^{k-1} (1-x)^{n-k}$

これはベータ分布$\text{Beta}(k, n-k+1)$に他なりません。

Step 4: 具体的問題への適用

与えられた条件:

  • $n = 5$
  • $k = 3$(第3順序統計量)
  • $x = 0.6$

確率密度関数の計算:

$f_{X_{(3)}}(x) = \frac{5!}{(3-1)!(5-3)!} x^{3-1} (1-x)^{5-3} = \frac{5!}{2! \cdot 2!} x^2 (1-x)^2$
$= \frac{120}{4} x^2 (1-x)^2 = 30 x^2 (1-x)^2$

Step 5: $x = 0.6$での具体的評価

$f_{X_{(3)}}(0.6) = 30 \times (0.6)^2 \times (1-0.6)^2$
$= 30 \times 0.36 \times (0.4)^2$
$= 30 \times 0.36 \times 0.16$
$= 30 \times 0.0576 = 1.728$

最終的な計算結果:

$f_{X_{(3)}}(0.6) = 30 \times 0.36 \times 0.16 = 1.728$

したがって、第3順序統計量の確率密度関数を$x = 0.6$で評価した値は$1.728$です。

ベータ分布としての解釈

第3順序統計量$X_{(3)} \sim \text{Beta}(3, 3)$

パラメータ意味
$\alpha = k$3下位の数
$\beta = n-k+1$3上位の数
期待値$\frac{3}{3+3} = 0.5$中央値的位置
分散$\frac{3 \times 3}{(3+3)^2(3+3+1)} = \frac{9}{252} = \frac{1}{28}$分布の広がり

順序統計量の同時分布と極値理論

Step 6: 順序統計量の同時密度関数

全ての順序統計量$(X_{(1)}, \ldots, X_{(n)})$の同時確率密度関数:

$f_{X_{(1)}, \ldots, X_{(n)}}(x_1, \ldots, x_n) = n! \prod_{i=1}^n f(x_i) \quad (x_1 \leq \cdots \leq x_n)$

一様分布の場合:

$f_{X_{(1)}, \ldots, X_{(n)}}(x_1, \ldots, x_n) = n! \quad (0 \leq x_1 \leq \cdots \leq x_n \leq 1)$

Step 7: 極値分布への収束

Fisher-Tippett-Gnedenko定理:

適切な正規化の下で、最大値$X_{(n)}$は以下の3つの極値分布のいずれかに収束:

$\text{Gumbel: } G(x) = \exp(-e^{-x})$
$\text{Fréchet: } G(x) = \exp(-x^{-\alpha}) \quad (x > 0)$
$\text{Weibull: } G(x) = \exp(-(-x)^\alpha) \quad (x < 0)$

Step 8: 分位数との関係

第$k$順序統計量は標本$k/n$分位数の推定量:

$X_{(k)} \approx F^{-1}\left(\frac{k}{n+1}\right)$

一様分布では:

$E[X_{(k)}] = \frac{k}{n+1}$

第3順序統計量の場合:$E[X_{(3)}] = \frac{3}{5+1} = 0.5$

応用

Step 9: 金融リスク管理への応用

Value at Risk (VaR):

損失分布の上側$\alpha$分位数:

$\text{VaR}_\alpha = F^{-1}(1-\alpha)$

経験的推定では順序統計量を使用:

$\widehat{\text{VaR}}_\alpha = X_{(\lceil n(1-\alpha) \rceil)}$

Expected Shortfall (ES):

$\text{ES}_\alpha = E[X | X > \text{VaR}_\alpha] = \frac{1}{n\alpha} \sum_{i=\lceil n(1-\alpha) \rceil}^n X_{(i)}$</div>
問題 1/10
カテゴリ一覧に戻る