Anda pada dasarnya benar tentang organisasi data. Jika Anda memiliki kasus yang diatur seperti ini:
ID M1 M2 M3 EVENT
Anda mungkin ingin mengatur ulang data sehingga terlihat seperti ini:
ID TIME EVENT
1 1 0
1 2 1
1 3 1
2 1 0
2 2 0
. . .
. . .
Saya menyebutnya konversi dari format lebar ke format panjang. Ini dilakukan dengan mudah di R menggunakan reshape()
fungsi atau bahkan lebih mudah dengan reshape2
paket.
Saya pribadi akan menjaga ID
lapangan untuk penggunaan potensial dalam mengidentifikasi sumber variasi dalam model efek campuran. Tapi ini tidak perlu (seperti yang ditunjukkan oleh @BerndWeiss). Berikut ini mengasumsikan Anda ingin melakukannya. Jika tidak, paskan model serupa dengan glm(...,family=binomial)
tanpa syarat efek acak.
The lme4
paket di R akan cocok dengan efek campuran model regresi logistik mirip dengan yang Anda bicarakan, kecuali dengan efek acak atau dua ke akun untuk variabilitas dalam koefisien seluruh mata pelajaran ( ID
). Berikut ini akan menjadi contoh kode untuk memasang model contoh jika data Anda disimpan dalam bingkai data yang disebut df
.
require(lme4)
ans <- glmer(EVENT ~ TIME + (1+TIME|ID), data=df, family=binomial)
Model khusus ini memungkinkan TIME
dan intercept
koefisien bervariasi secara acak di seluruh ID. Dengan kata lain, ini adalah model campuran linier hirarkis pengukuran yang bersarang pada individu.
Bentuk lainnya dari waktu diskrit Model sejarah acara istirahat TIME
dalam dummies diskrit dan cocok satu sama sebagai parameter. Ini pada dasarnya adalah kasus diskrit dari model Cox PH karena kurva bahaya tidak terbatas pada linier (atau kuadratik, atau bagaimanapun Anda dapat membayangkan mengubah waktu). Meskipun, Anda mungkin ingin mengelompokkan TIME
ke dalam set yang dapat dikelola (yaitu kecil) dari periode waktu diskrit jika ada banyak dari mereka.
Alternatif selanjutnya melibatkan transformasi waktu untuk memperbaiki kurva bahaya Anda. Metode sebelumnya pada dasarnya meringankan Anda dari keharusan melakukan ini, tetapi metode sebelumnya kurang pelit dari ini (dan kasus linear asli yang saya ajukan) karena Anda mungkin memiliki banyak titik waktu dan dengan demikian, banyak parameter gangguan.
Referensi yang sangat baik tentang topik ini adalah Analisis Data Longitudinal Terapan Judith Singer dan John Willet : Perubahan Pemodelan dan Kejadian Kejadian .
self-study
tag.)