解答と解説を表示
<p>この問題では、<strong>順序統計量の理論と極値分布の基礎</strong>について理解を深めます。順序統計量は、統計学における基本的概念で、極値理論、分位数推定、ロバスト統計の中核をなし、金融リスク管理や品質管理など幅広い分野で応用されています。</p><h4>順序統計量:データの階層構造を読み解く</h4><p>順序統計量(Order Statistics)は、標本を大きさ順に並べた統計量で、データの分布特性や極値の性質を解析するための基本ツールです。Galton (1885) の中央値研究に端を発し、現代の極値理論や分位数回帰の理論的基盤となっています。</p><p class='step'><strong>Step 1: 順序統計量の数学的定義</strong></p><p>$n$個の独立同分布確率変数$X_1, X_2, \ldots, X_n$を大きさ順に並べた統計量:</p><div class='formula'>$X_{(1)} \leq X_{(2)} \leq \cdots \leq X_{(n)}$
ここで:
- $X_{(1)} = \min\{X_1, \ldots, X_n\}$:最小順序統計量
- $X_{(n)} = \max\{X_1, \ldots, X_n\}$:最大順序統計量
- $X_{(k)}$:第$k$順序統計量($k$番目に小さい値)
順序統計量の基本性質
- 順序保存性:$X_{(1)} \leq X_{(2)} \leq \cdots \leq X_{(n)}$
- 非独立性:各順序統計量は互いに従属
- 分布の変換:元の分布から完全に決定される
- 極値への収束:$n \to \infty$で特定の極値分布に収束
Step 2: 一般的な順序統計量の確率密度関数
累積分布関数$F(x)$、確率密度関数$f(x)$を持つ分布からの第$k$順序統計量$X_{(k)}$の確率密度関数:
$f_{X_{(k)}}(x) = \frac{n!}{(k-1)!(n-k)!} [F(x)]^{k-1} [1-F(x)]^{n-k} f(x)$
この公式はベータ分布との深い関係を示しており:
$F_{X_{(k)}}(x) = I_{F(x)}(k, n-k+1)$
ここで$I_z(a,b)$は正則化不完全ベータ関数。
Step 3: 一様分布における特殊化
$X_i \sim \text{Uniform}(0, 1)$の場合:
- $F(x) = x$ ($0 \leq x \leq 1$)
- $f(x) = 1$ ($0 \leq x \leq 1$)
したがって、第$k$順序統計量の確率密度関数:
$f_{X_{(k)}}(x) = \frac{n!}{(k-1)!(n-k)!} x^{k-1} (1-x)^{n-k}$
これはベータ分布$\text{Beta}(k, n-k+1)$に他なりません。
Step 4: 具体的問題への適用
与えられた条件:
- $n = 5$
- $k = 3$(第3順序統計量)
- $x = 0.6$
確率密度関数の計算:
$f_{X_{(3)}}(x) = \frac{5!}{(3-1)!(5-3)!} x^{3-1} (1-x)^{5-3} = \frac{5!}{2! \cdot 2!} x^2 (1-x)^2$
$= \frac{120}{4} x^2 (1-x)^2 = 30 x^2 (1-x)^2$
Step 5: $x = 0.6$での具体的評価
$f_{X_{(3)}}(0.6) = 30 \times (0.6)^2 \times (1-0.6)^2$
$= 30 \times 0.36 \times (0.4)^2$
$= 30 \times 0.36 \times 0.16$
$= 30 \times 0.0576 = 1.728$
最終的な計算結果:
$f_{X_{(3)}}(0.6) = 30 \times 0.36 \times 0.16 = 1.728$
したがって、第3順序統計量の確率密度関数を$x = 0.6$で評価した値は$1.728$です。
ベータ分布としての解釈
第3順序統計量$X_{(3)} \sim \text{Beta}(3, 3)$
パラメータ | 値 | 意味 |
---|
$\alpha = k$ | 3 | 下位の数 |
$\beta = n-k+1$ | 3 | 上位の数 |
期待値 | $\frac{3}{3+3} = 0.5$ | 中央値的位置 |
分散 | $\frac{3 \times 3}{(3+3)^2(3+3+1)} = \frac{9}{252} = \frac{1}{28}$ | 分布の広がり |
順序統計量の同時分布と極値理論
Step 6: 順序統計量の同時密度関数
全ての順序統計量$(X_{(1)}, \ldots, X_{(n)})$の同時確率密度関数:
$f_{X_{(1)}, \ldots, X_{(n)}}(x_1, \ldots, x_n) = n! \prod_{i=1}^n f(x_i) \quad (x_1 \leq \cdots \leq x_n)$
一様分布の場合:
$f_{X_{(1)}, \ldots, X_{(n)}}(x_1, \ldots, x_n) = n! \quad (0 \leq x_1 \leq \cdots \leq x_n \leq 1)$
Step 7: 極値分布への収束
Fisher-Tippett-Gnedenko定理:
適切な正規化の下で、最大値$X_{(n)}$は以下の3つの極値分布のいずれかに収束:
$\text{Gumbel: } G(x) = \exp(-e^{-x})$
$\text{Fréchet: } G(x) = \exp(-x^{-\alpha}) \quad (x > 0)$
$\text{Weibull: } G(x) = \exp(-(-x)^\alpha) \quad (x < 0)$
Step 8: 分位数との関係
第$k$順序統計量は標本$k/n$分位数の推定量:
$X_{(k)} \approx F^{-1}\left(\frac{k}{n+1}\right)$
一様分布では:
$E[X_{(k)}] = \frac{k}{n+1}$
第3順序統計量の場合:$E[X_{(3)}] = \frac{3}{5+1} = 0.5$
応用
Step 9: 金融リスク管理への応用
Value at Risk (VaR):
損失分布の上側$\alpha$分位数:
$\text{VaR}_\alpha = F^{-1}(1-\alpha)$
経験的推定では順序統計量を使用:
$\widehat{\text{VaR}}_\alpha = X_{(\lceil n(1-\alpha) \rceil)}$
Expected Shortfall (ES):
$\text{ES}_\alpha = E[X | X > \text{VaR}_\alpha] = \frac{1}{n\alpha} \sum_{i=\lceil n(1-\alpha) \rceil}^n X_{(i)}$</div>