Saya sedang memeriksa tren (antara 1998 dan 2011) dalam tingkat kematian di antara pasien dengan penyakit Crohn. Setiap pasien (kasus) telah dimasukkan selama tahun 1998 hingga 2011. Pada saat inklusi, setiap pasien telah dicocokkan dengan kontrol yang sehat dengan usia dan jenis kelamin yang sama. Saya menganalisis tren tingkat kematian. Ketika melakukan ini secara langsung, tanpa penyesuaian, saya memperoleh angka kematian yang berfluktuasi dari waktu ke waktu, yang mungkin karena fakta bahwa individu yang termasuk tahun tertentu tidak dapat dibandingkan dengan yang termasuk tahun yang lain. Karena itu saya bertujuan untuk menyesuaikan tingkat kematian. Saya berharap bahwa angka kematian pada kedua kelompok (kasus dan kontrol) akan menurun seiring waktu dan kesenjangan antara kasus dan kontrol akan menyempit berturut-turut.
Ide saya adalah melakukan penyesuaian melalui regresi Poisson. Data saya ada di tingkat individu. Saya ingin mendapatkan satu perkiraan tingkat kejadian (per 1000 orang-tahun) untuk kasus dan kontrol setiap tahun dari 1998 hingga 2011. Waktu bertahan hidup akan dimasukkan sebagai offset dalam model. Hal serupa telah dilakukan di sini .
Saya telah memasang 200 baris pertama dari kumpulan data saya, yang terdiri dari 1500 orang. Ini datanya . Penjelasan variabel:
- mati = jika pasien meninggal atau tidak selama tindak lanjut
- surv = waktu bertahan hidup dalam beberapa hari
- agegroup = kelompok umur yang dikategorikan (4 kelompok)
- jenis kelamin = pria / wanita
- diagnosis = 0 untuk kontrol sehat, 1 untuk penyakit Crohns
- umur = umur dalam tahun
- inclusion_year = tahun inklusi dalam penelitian
Apa yang saya coba sejauh ini? Saya sudah mencoba menyesuaikan model Poisson dengan fungsi glm () di R, menggunakan pengamatan individu (log (surv) sebagai offset), tetapi saya juga menerima kesalahan atau tidak tahu bagaimana cara menggunakan cocok. Saya juga mengumpulkan data menjadi beberapa kelompok, dan kemudian menganalisis jumlah kematian dalam glm (); ketika saya menggunakan kecocokan untuk mendapatkan angka kejadian, saya hanya bisa mendapatkan angka untuk usia / agegroup dan jenis kelamin tertentu (seperti yang perlu ditentukan dalam fungsi prediksi ()).
Saya sangat menghargai beberapa saran statistik dan contoh pengkodean, yang dapat dilakukan pada set data terlampir.
contrasts<-
( *tmp*
, value = contr.funs [1 + isOF [nn]]): kontras dapat diterapkan hanya pada faktor dengan 2 level atau lebih
diagnosis*inclusion_year
istilah interaksi. Jika Anda hanya menggunakan model saat ini, jumlah case hanya akan berbeda dengan beta diagnosis
, konstan sepanjang tahun karena tidak diperbolehkan untuk berinteraksi. Setelah itu, prediksi akan menjadi pengganti saja. Saya tidak terlalu pilih-pilih jadi saya hanya akan subs usia rata-rata dan persentase laki-laki.