<h4>順列検定の数学的基礎</h4><p>順列検定は帰無仮説の下で、データの順列(置換)がすべて等確率で生じるという<strong>交換可能性</strong>(exchangeability)の仮定に基づく検定法です。</p><div class='formula'>$H_0: \text{観測値の順列がすべて等確率で生じる}
lt;/div><h4>順列検定の理論的原理</h4><p class='step'><strong>Step 1: 交換可能性の概念</strong></p><p>確率変数列$(X_1, X_2, \ldots, X_n)$が交換可能であるとは、任意の順列$\pi$に対して:</p><div class='formula'>$(X_1, X_2, \ldots, X_n) \stackrel{d}{=} (X_{\pi(1)}, X_{\pi(2)}, \ldots, X_{\pi(n)})
lt;/div><p>この性質により、帰無仮説の下で全ての順列が等確率で生じます。</p><p class='step'><strong>Step 2: 順列検定統計量</strong></p><p>観測データ$\mathbf{x} = (x_1, x_2, \ldots, x_n)$に対する検定統計量$T(\mathbf{x})$について、帰無仮説の下での正確な分布:</p><div class='formula'>$P(T \geq t | H_0) = \frac{\#\{\pi: T(\mathbf{x}_{\pi}) \geq t\}}{n!}
lt;/div><p>ここで$\mathbf{x}_{\pi}$は$\mathbf{x}$の順列$\pi$による並び替えです。</p><h4>順列検定の実装アルゴリズム</h4><p class='step'><strong>Step 3: モンテカルロ近似</strong></p><p>全順列の計算が困難な場合、ランダムサンプリングによる近似:</p><div class='formula'>$\hat{p} = \frac{1}{B} \sum_{b=1}^B \mathbf{1}\{T(\mathbf{x}_{\pi_b}) \geq T(\mathbf{x})\}
lt;/div><p>ここで$\pi_1, \pi_2, \ldots, \pi_B$は$B$個のランダム順列です。</p><h4>順列検定の統計的性質</h4><div class='key-point'><div class='key-point-title'>順列検定の理論的優位性</div><p><strong>分布フリー性</strong>:</p><ul><li><strong>正規性不要</strong>:分布の形状に依存しない</li><li><strong>等分散性不要</strong>:分散の等質性を仮定しない</li><li><strong>独立性のみ</strong>:観測間の独立性のみ必要</li></ul><p><strong>正確性</strong>:</p><ul><li><strong>有限標本</strong>:標本サイズに関係なく正確</li><li><strong>条件付き推論</strong>:観測データを条件とした正確推論</li><li><strong>漸近近似不要</strong>:中心極限定理に依存しない</li></ul></div><p class='step'><strong>Step 4: パラメトリック検定との比較</strong></p><table class='table table-bordered'><tr><th>特性</th><th>順列検定</th><th>パラメトリック検定</th><th>備考</th></tr><tr><td>分布仮定</td><td>交換可能性のみ</td><td>特定分布(正規分布等)</td><td>順列検定が柔軟</td></tr><tr><td>計算複雑度</td><td>$O(n!)$ または $O(B)
lt;/td><td>$O(1)
lt;/td><td>計算負荷は順列検定が大</td></tr><tr><td>有限標本性能</td><td>正確</td><td>近似</td><td>小標本で順列検定が優位</td></tr><tr><td>検出力</td><td>仮定下で高効率</td><td>仮定下で最適</td><td>条件により異なる</td></tr><tr><td>頑健性</td><td>外れ値に頑健</td><td>外れ値に敏感</td><td>順列検定が頑健</td></tr></table><h4>順列検定の応用範囲</h4><p class='step'><strong>Step 5: 適用可能な問題設定</strong></p><ul><li><strong>2標本問題</strong>:平均・中央値の差の検定</li><li><strong>対応のある検定</strong>:ペア比較</li><li><strong>多標本問題</strong>:一元配置分散分析の代替</li><li><strong>相関・回帰</strong>:無相関検定、回帰係数検定</li><li><strong>適合度検定</strong>:分布の適合性</li></ul><p class='step'><strong>Step 6: データ型による制約</strong></p><p>順列検定は以下のデータ型に適用可能:</p><ul><li><strong>連続データ</strong>:一般的な適用</li><li><strong>順序データ</strong>:順位に基づく検定</li><li><strong>離散データ</strong>:カテゴリカルデータの検定</li><li><strong>混合データ</strong>:異なる型の組み合わせ</li></ul><p>したがって、順列検定の特徴として「分布に関する仮定が最小限で済む」が正しい記述です。</p>