Jawaban sederhananya adalah memberi bobot. Artinya, Anda dapat menggunakan bobot untuk membakukan kelompok dalam kelompok "diterima" untuk populasi yang diminati. Masalah yang muncul dari penggunaan bobot tersebut dalam analisis yang dikumpulkan menggunakan fase 2 tahun pertama dan kedua adalah bahwa estimasi bobot populasi dan parameter sekarang tergantung. Pendekatan pseudolikelihood biasanya digunakan (dalam hal ini, itu akan menjadi semacam kemungkinan pseudo-parsial) di mana Anda mengabaikan ketergantungan antara berat sampel dan perkiraan parameter. Namun, dalam banyak keadaan praktis (dan yang ini tidak berbeda), akuntansi untuk ketergantungan ini diperlukan. Masalah membuat estimator yang efisien dari rasio bahaya adalah yang sulit, dan sejauh yang saya tahu terbuka berakhir.
Peningkatan Estimasi Horvitz-Thompson untuk Parameter Model dari Sampel Dua-Tingkat Stratifikasi: Aplikasi dalam Epidemiologi .
Artikel ini membahas metode survei, biasanya diterapkan dalam regresi logistik, namun Anda juga dapat mempertimbangkan data kelangsungan hidup. Beberapa pertimbangan penting yang Anda lupa sebutkan adalah apakah Anda tertarik untuk membuat prediksi yang berlaku untuk seluruh populasi, atau populasi "yang memenuhi syarat" berdasarkan perkiraan 2 tahun, atau populasi "yang memenuhi syarat" berdasarkan hasil yang dihasilkan model. Anda juga belum menyebutkan dengan tepat bagaimana model "prediksi" tersebut dibuat dari model Cox, karena nilai yang sesuai dari model Cox tidak dapat diartikan sebagai risiko. Saya kira Anda memperkirakan rasio bahaya, lalu mendapatkan estimasi yang mulus dari fungsi bahaya dasar.