1 / 24

Nested ケース・コントロールデザインにおける擬似尤度によるパラメータ推定

Nested ケース・コントロールデザインにおける擬似尤度によるパラメータ推定. 口羽 文 1,2  吉村 健一 1,2,3 東京大学大学院医学系研究科疫学・予防保健学 1 国立がんセンターがん予防・検診研究センター情報研究部 2 日本臨床腫瘍研究グループ( JCOG )データセンター 3. : イベント. : 打ち切り. 疫学研究( 非介入研究 )のデザイン. コホート研究デザイン. ケース・コントロール研究デザイン. 研究ベース(コホート). ケース. コントロール. 時間. 研究開始. 研究開始. 疫学研究デザインの分類.

hume
Download Presentation

Nested ケース・コントロールデザインにおける擬似尤度によるパラメータ推定

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Nestedケース・コントロールデザインにおける擬似尤度によるパラメータ推定Nestedケース・コントロールデザインにおける擬似尤度によるパラメータ推定 口羽 文1,2 吉村 健一1,2,3 東京大学大学院医学系研究科疫学・予防保健学1 国立がんセンターがん予防・検診研究センター情報研究部2 日本臨床腫瘍研究グループ(JCOG)データセンター3

  2. :イベント :打ち切り 疫学研究(非介入研究)のデザイン • コホート研究デザイン • ケース・コントロール研究デザイン 研究ベース(コホート) ケース コントロール 時間 研究開始 研究開始

  3. 疫学研究デザインの分類

  4. ケース  発症時点でのリスク集団 :イベント :打ち切り 1:1-matchedコントロール  Nested ケース・コントロール研究 ID 1 • 各リスク集団からサンプリング • Risk set sampling • Density sampling 2 3 4 5 6 7 8 9 10 時間

  5. 利点 • サンプリングにより曝露測定にかかるコストの削減 • Ex. 遺伝子多型(SNP)と疾患発症の関連を評価 • 全対象者の血液サンプルを収集した前向きコホート研究 • SNPタイピング(曝露の測定)は高コスト • ゲノムワイドのタイピング:約15万円/1人 • 1,000人測定すると 1億5000万円 • 10,000人       15億円 • Nestedケース・コントロール研究ではサンプリング集団のみの測定 • 100ケース:100コントロール測定しても 3,000万円 • Risk set サンプリングをしていることからハザード比を推定可能

  6. ケース  発症時点でのリスク集団 時間 コホート研究におけるハザード比の推定 • 比例ハザードモデル • 各ケースの尤度への寄与 ハザード比(HR)

  7. Nestedケース・コントロール研究におけるハザード比の推定Nestedケース・コントロール研究におけるハザード比の推定 • Thomas推定量 • イベント発症時点での1:mマッチングデザイン • 各ケースの尤度への寄与 • 時間依存性共変量へも容易に対応 • 情報の損失 • “マッチングされたコントロール”のみの情報を使用 • 曝露の分布に依存して大きく効率低下する可能性 • 曝露情報が一致するmatchedペアは情報なし

  8. Samuelsenの提案 • コホート研究として考える • サンプリングされなかった対象者の共変量の欠測(missing covariate)の問題 • サンプリング確率の逆数による重み付き推定量 ID 1 2 3 共変量の欠測 4 5 6 7 8 9 10 時間

  9. Samuelsen推定量 • 各ケースの尤度への寄与 • “サンプリング時点でのケース”以外のケースに対してもコントロールとして再利用 • 曝露情報が一致するmatchedペアの情報も利用 • Thomas推定量より効率が良くなる

  10. 各対象者のサンプリング確率 • ケースは強制的に全員がサンプリング • nested ケース・コントロール研究の対象者としてサンプリングされる確率

  11. (1-1/9)(1-1/8) 1-1/9 (1-1/9)(1-1/8)(1-1/7) 各コントロールのサンプリング確率 ID 1 2 3 4 5 6 7 8 9 10 時間 T (1-1/9)(1-1/8)(1-1/7)(1-1/6) • カプラン・マイヤー推定量 • イベント:コントロールとしてサンプリングされること • 打ち切り:興味のあるイベント発症あるいは観察打ち切り • より複雑なサンプリングでもデザイン通りに対応可能

  12. 疫学研究デザインの分類

  13. :イベント :打ち切り コントロール(サブコホート) :研究開始時点のリスク集団からのサンプル ケース・コホート研究 ID 1 • サンプリングされなかった対象の共変量の欠測(missingcovariate)の問題 • サブコホート(あるいはケース)にサンプリングされる確率で調整した擬似尤度に基づくハザード比の推定 2 3 共変量の欠測 4 5 6 7 8 9 10 時間

  14. Samuelsenマクロの作成 • Thomas推定量 • SAS/STAT PHREGプロシジャ STRATAステートメント • Samuelsen推定量 • SASではプロシジャレベルで現在未提供 比例ハザード性を仮定した下 • Nested ケース・コントロール研究において Samuelsen推定量を得るためのマクロを作成 • Thomas推定量と効率の比較

  15. SAS 9 によるSamuelsen推定 • 各対象者のサンプリング確率(pj)を推定 • DATAステップによりpjのカプラン・マイヤー推定量を算出 • SAS/STAT PHREGプロシジャのWEIGHTステートメントで1/pj を指定 • 重みを推定しているためCOVSオプションよりロバスト分散

  16. プログラム %MACRO Samuelsen( data=_last_, time=, censor=, c_values=, match=, x= ) ; /* 解析データセット名 */ /* 生存時間を示す変数名 */ /* 打ち切りを示す変数名 */ /* “打ち切り”を表す値 */ /* matching人数を示す変数名 */ /* 曝露変数名 */

  17. 解析データセット:SURV • 仮想的な35人からなるコホートのデータSURVの一部 ・・・ %MACROSamuelsen(data=SURV,time=TIME,censor=CENSOR, c_values=0, match=MATCH, x=EXP);

  18. -------------------------- Samuelsen estimator -------------------------- PHREG プロシジャ モデルの詳細 データセット WORK.SURV 従属変数 TIME 打ち切り変数 censor 打ち切り値の数 2 Weight Variable w タイデータの処理 EFRON Number of Observations Read 20 Number of Observations Used 20 収束状態 収束基準 (GCONV=1E-8) は満たされました。 モデルの適合度統計量 共変量 共変量 基準 なし あり -2 LOG L 14.265 13.135 AIC 14.265 15.135 SBC 14.265 15.437 SASアウトプット例

  19. SASアウトプット例:続き グローバルな帰無仮説 H0: BETA=0 検定 カイ 2 乗 自由度 Pr > ChiSq 尤度比 1.1304 1 0.2877 Score (Model-Based) 1.0736 1 0.3001 Score (Sandwich) 2.3006 1 0.1293 Wald (Model-Based) 0.9336 1 0.3339 Wald (Sandwich) 2.2321 1 0.1352 最尤推定量の分析 パラメータ 標準 標準誤差 ハザード 95% ハザード比信頼 変数 自由度 推定 誤差 比 カイ 2 乗 Pr > ChiSq 比 限界 EXP 1 1.32501 0.88687 0.647 2.2321 0.1352 3.762 0.662 21.397

  20. シミュレーションによる確認 • Samuelsen推定量とThomas推定量それぞれについて • 推定されたハザード比[HR=exp()]の平均 • 推定値の分散の平均 • ハザード比の平均95%信頼区間全幅 • 95%信頼区間の被覆確率 • 繰り返し数10,000回

  21. シナリオ設定 • コホートサイズ n =1,000 • ケース:matchedコントロール=1:1 • 1つの曝露変数 • 2値(曝露あり or なし) • 曝露割合:0.3, 0.5 • 打ち切りとは独立 • 帰無仮説の下でのイベント期待発症割合:10% • ハザード比:1(帰無仮説), 2, 3

  22. 結果:曝露割合30% シミュレーション回数:10,000回 Samuelson推定量はThomas推定量よりも効率に優れる

  23. 相対効率(Samuelsen分散)/(Thomas分散) シミュレーション回数:10,000回 Samuelson推定量はThomas推定量よりも効率に優れる

  24. まとめ • Samuelsen推定量を得るためのマクロを作成 • 今回検討した状況においてはThomas推定量より常に効率が良くなることを確認 • プログラムと本発表資料は一般公開予定 • 日本臨床腫瘍研究グループ(JCOG)公式HPhttp://www.jcog.jp/

More Related