Saya punya pertanyaan metodologis, dan karenanya tidak ada dataset sampel yang dilampirkan.
Saya berencana untuk melakukan skor kecenderungan regresi Cox yang disesuaikan yang bertujuan untuk memeriksa apakah obat tertentu akan mengurangi risiko hasil. Penelitian ini bersifat observasional, terdiri dari 10.000 orang.
Kumpulan data berisi 60 variabel. Saya menilai bahwa 25 di antaranya mungkin mempengaruhi alokasi pengobatan. Saya tidak akan pernah menyesuaikan semua 25 dari ini dalam regresi Cox, tapi saya pernah mendengar bahwa Anda dapat memasukkan banyak variabel sebagai prediktor dalam skor kecenderungan dan kemudian hanya menyertakan subkelas skor kecenderungan dan variabel pengobatan dalam regresi Cox.
(kovariat yang tidak akan sama setelah penyesuaian skor prop tentu saja harus dimasukkan dalam regresi Cox).
Intinya, apakah benar-benar pintar untuk memasukkan banyak prediktor dalam skor prop?
@ Dimitriy V. Masterov Terima kasih telah berbagi fakta penting ini. Sebaliknya terhadap buku dan artikel yang mempertimbangkan kerangka kerja regresi lainnya, saya tidak melihat pedoman (membaca buku Rosenbaums) tentang pemilihan model dalam analisis skor kecenderungan. Sementara buku teks standar / artikel ulasan tampaknya selalu merekomendasikan pemilihan variabel ketat dan menjaga jumlah prediktor rendah, saya belum melihat banyak dari diskusi ini dalam analisis skor prop. Anda menulis: (1) "Wawasan teoretis, pengetahuan institusional, dan penelitian yang baik harus memandu pemilihan Xs". Saya setuju tetapi ada keadaan di mana kita memiliki variabel yang ada dan tidak benar-benar tahu (tetapi mungkin saja) jika variabel tersebut mempengaruhi alokasi atau hasil pengobatan. Sebagai contoh: saya harus memasukkan fungsi ginjal, sebagai ukuran dengan laju filtrasi, dalam skor prop yang bertujuan untuk menyesuaikan untuk pengobatan statin. Pengobatan statin tidak ada hubungannya dengan fungsi ginjal dan saya sudah memasukkan berbagai variabel yang akan mempengaruhi pengobatan statin. Tetapi masih tergoda untuk memasukkan fungsi ginjal; mungkin lebih menyesuaikan. Sekarang beberapa orang akan mengatakan bahwa itu harus dimasukkan karena itu mempengaruhi hasil, tetapi saya bisa memberikan Anda contoh lain (seperti variabel biner perkotaan / pedesaan yang tinggal) dari variabel yang tidak mempengaruhi pengobatan atau hasil, sejauh yang kami tahu. Tapi saya ingin memasukkannya, asalkan tidak t efek presisi skor prop. (2)"Termasuk X yang dipengaruhi oleh pengobatan, baik ex post atau ex ante sebagai antisipasi pengobatan, akan membatalkan asumsi". Saya tidak yakin apa yang Anda maksud di sini. Tetapi jika saya mempelajari efek statin pada hasil kardiovaskular, saya akan memasukkan berbagai pengukuran lipid darah dalam skor kecenderungan. Lipid darah dipengaruhi oleh perawatan. Saya kira saya salah mengerti pernyataan ini.
@statsRus terima kasih telah berbagi fakta, terutama apa yang Anda sebut "catatan tentang memilih input". Saya pikir saya beralasan seperti halnya Anda.
Sayangnya metode skor prop membahas berbagai strategi penyesuaian daripada strategi pemilihan model. Mungkin model yang cocok tidak penting. Jika itu masalahnya, saya akan menyesuaikan untuk setiap variabel yang tersedia yang mungkin mempengaruhi hasil dan alokasi perawatan sedikit pun. Saya bukan ahli statis, tetapi jika model fit tidak penting maka saya ingin menyesuaikan untuk semua variabel yang mungkin mempengaruhi alokasi dan hasil pengobatan. Ini dalam banyak kasus akan berarti termasuk variabel yang akan dipengaruhi oleh pengobatan.
Selain itu, beberapa orang menyarankan bahwa regresi Cox berikutnya hanya boleh mencakup variabel perlakuan dan subkelas skor prop. Sementara yang lain menyarankan bahwa penyesuaian cox harus menyertakan skor prop tambahan untuk semua variabel lain yang akan Anda sesuaikan.