<h4>カプランマイヤー推定量:生存時間分析の基礎</h4><div class='key-point'><div class='key-point-title'>生存時間分析とカプランマイヤー推定量</div><p>カプランマイヤー推定量(Kaplan-Meier estimator)は、生存時間分析において最も基本的で重要な非母数的推定法です。打ち切りデータ(censored data)が存在する場合でも、偏りのない生存関数の推定を可能にします。</p></div><h4>生存時間分析の基本概念</h4><p class='step'><strong>Step 1: 生存時間データの特徴</strong></p><p><strong>基本用語:</strong></p><ul><li><strong>生存時間</strong>:イベント(死亡、再発など)が起こるまでの時間</li><li><strong>イベント</strong>:関心のある事象(死亡、病気の再発、機械の故障など)</li><li><strong>打ち切り</strong>:観察期間内にイベントが起こらない場合</li></ul><p><strong>打ち切りの種類:</strong></p><ul><li><strong>右側打ち切り</strong>:観察終了時にイベントが未発生</li><li><strong>左側打ち切り</strong>:観察開始前にイベントが発生した可能性</li><li><strong>区間打ち切り</strong>:イベント発生時刻が区間内のどこかにある</li></ul><div class='key-point'><h4>生存関数の定義</h4><p>生存関数$S(t)$は、時刻$t$まで生存する確率を表します:</p><div class='formula'>$S(t) = P(T > t)
lt;/div><p>ここで、$T$は生存時間(確率変数)です。</p></div><p class='step'><strong>Step 2: カプランマイヤー推定量の定義</strong></p><p><strong>基本的な設定:</strong></p><ul><li>$n$個の個体を観察</li><li>観察される時刻:$t_1 < t_2 < \cdots < t_k
lt;/li><li>各時刻$t_i$でのイベント数:$d_i
lt;/li><li>各時刻$t_i$の直前のリスク集合の大きさ:$n_i
lt;/li></ul><p><strong>リスク集合:</strong></p><p>時刻$t$における「リスク集合」$R(t)$は、時刻$t$の直前まで生存しており、イベントが起こりうる個体の集合です。</p><div class='formula'>$R(t) = \{i : T_i \geq t\}
lt;/div><p class='step'><strong>Step 3: カプランマイヤー推定量の公式</strong></p><p><strong>生存関数の推定:</strong></p><div class='formula'>$\hat{S}(t) = \prod_{t_i \leq t} \left(1 - \frac{d_i}{n_i}\right)
lt;/div><p>ここで:</p><ul><li>$d_i$:時刻$t_i$でのイベント発生数</li><li>$n_i$:時刻$t_i$の直前のリスク集合の大きさ</li><li>$\frac{d_i}{n_i}$:時刻$t_i$でのハザード率の推定値</li></ul><div class='key-point'><h4>カプランマイヤー推定量の特徴</h4><ul><li><strong>非母数的</strong>:分布に関する仮定が不要</li><li><strong>右下がりの階段関数</strong>:イベント発生時刻でのみ値が変化</li><li><strong>不偏推定量</strong>:適切な仮定の下で$E[\hat{S}(t)] = S(t)
lt;/li><li><strong>最尤推定量</strong>:離散時間下での最尤推定</li></ul></div><p class='step'><strong>Step 4: 計算例</strong></p><p><strong>具体的なデータ例:</strong></p><div class='key-point'><table class='table table-bordered'><tr><th>個体</th><th>観察時間</th><th>イベント</th><th>状態</th></tr><tr><td>1</td><td>5</td><td>死亡</td><td>イベント</td></tr><tr><td>2</td><td>8</td><td>打ち切り</td><td>生存</td></tr><tr><td>3</td><td>12</td><td>死亡</td><td>イベント</td></tr><tr><td>4</td><td>15</td><td>打ち切り</td><td>生存</td></tr><tr><td>5</td><td>20</td><td>死亡</td><td>イベント</td></tr></table></div><p><strong>計算手順:</strong></p><ol><li><strong>時刻5</strong>:$n_1 = 5$, $d_1 = 1$ ⟹ $\hat{S}(5) = 1 \times (1 - 1/5) = 0.8
lt;/li><li><strong>時刻8</strong>:打ち切りなので生存関数は変化しない</li><li><strong>時刻12</strong>:$n_2 = 3$, $d_2 = 1$ ⟹ $\hat{S}(12) = 0.8 \times (1 - 1/3) = 0.533
lt;/li><li><strong>時刻15</strong>:打ち切りなので生存関数は変化しない</li><li><strong>時刻20</strong>:$n_3 = 1$, $d_3 = 1$ ⟹ $\hat{S}(20) = 0.533 \times (1 - 1/1) = 0
lt;/li></ol><p class='step'><strong>Step 5: 分散の推定(Greenwood公式)</strong></p><p><strong>Greenwood分散推定量:</strong></p><div class='formula'>$\text{Var}[\hat{S}(t)] = [\hat{S}(t)]^2 \sum_{t_i \leq t} \frac{d_i}{n_i(n_i - d_i)}
lt;/div><p><strong>信頼区間の構築:</strong></p><p>対数変換を用いた信頼区間:</p><div class='formula'>$\hat{S}(t)^{\exp(\pm z_{\alpha/2} \sqrt{\text{Var}[\log \hat{S}(t)]}/\hat{S}(t))}
lt;/div><p class='step'><strong>Step 6: 打ち切りデータの処理</strong></p><p><strong>打ち切りの仮定:</strong></p><ul><li><strong>無関連打ち切り</strong>:打ち切りがイベント発生と独立</li><li><strong>非情報的打ち切り</strong>:打ち切り時刻がイベント時刻に関する情報を含まない</li></ul><p><strong>打ち切りの処理方法:</strong></p><ol><li>打ち切り時刻まではリスク集合に含める</li><li>打ち切り時刻でリスク集合から除外</li><li>生存関数の値は変化させない</li></ol><div class='key-point'><h4>他の推定法との比較</h4><table class='table table-bordered'><tr><th>推定法</th><th>タイプ</th><th>仮定</th><th>適用場面</th></tr><tr><td><strong>カプランマイヤー</strong></td><td>非母数</td><td>分布仮定なし</td><td>探索的分析、グラフ表示</td></tr><tr><td><strong>ネルソン・アーレン</strong></td><td>非母数</td><td>累積ハザード推定</td><td>ハザード関数の推定</td></tr><tr><td><strong>母数的手法</strong></td><td>母数</td><td>特定の分布</td><td>モデルベースの推論</td></tr><tr><td><strong>Cox回帰</strong></td><td>準母数</td><td>比例ハザード</td><td>共変量の効果評価</td></tr></table></div><p class='step'><strong>Step 7: 統計的推論</strong></p><p><strong>ログランク検定:</strong></p><p>2群間の生存曲線の比較:</p><div class='formula'>$\chi^2 = \frac{(O_1 - E_1)^2}{V_1} + \frac{(O_2 - E_2)^2}{V_2}
lt;/div><p>ここで、$O_i$は観測イベント数、$E_i$は期待イベント数</p><p><strong>信頼区間:</strong></p><p>点推定だけでなく、不確実性の評価も重要</p>