Saya memiliki dua tahun data yang pada dasarnya terlihat seperti ini:
Tanggal _ __ Kekerasan Y / T? _ Jumlah pasien
1/1/2008 _ ___ 0 __ _ __ _ ____ 11
2/1/2008 _ __ _ 0 _ __ _ __ _ __ 11
3/1/2008 _ ____ 1 __ _ __ _ ____ 12
4/1/2008 _ ____ 0 __ _ __ _ ____ 12
...
31/12 / 2009_ _ __ 0_ _ __ _ __ _ __ 14
yaitu dua tahun pengamatan, satu per hari, dari bangsal psikiatrik, yang menunjukkan apakah ada insiden kekerasan pada hari itu (1 adalah ya, 0 tidak) serta jumlah pasien di bangsal. Hipotesis yang ingin kami uji adalah bahwa lebih banyak pasien di bangsal dikaitkan dengan peningkatan kemungkinan kekerasan di bangsal.
Kami menyadari, tentu saja, bahwa kami harus menyesuaikan kenyataan bahwa ketika ada lebih banyak pasien di bangsal, kekerasan lebih mungkin karena ada lebih banyak dari mereka - kami tertarik pada apakah kemungkinan masing-masing individu dari kekerasan meningkat ketika ada lebih banyak pasien di bangsal.
Saya telah melihat beberapa makalah yang hanya menggunakan regresi logistik, tetapi saya pikir itu salah karena ada struktur autoregresif (walaupun, melihat fungsi autokorelasi, ia tidak mendapatkan di atas 0,1 pada setiap lag, meskipun ini di atas Garis putus-putus biru "signifikan" yang menarik R untuk saya).
Hanya untuk membuat segalanya menjadi lebih rumit, saya bisa jika saya ingin memecah hasilnya menjadi masing-masing pasien, sehingga data akan terlihat sama seperti di atas, kecuali saya akan memiliki data untuk setiap pasien, 1/1/2008, 2 / 1/2008 dll. Dan kode ID mengarah ke samping sehingga data akan menunjukkan seluruh riwayat insiden untuk setiap pasien secara terpisah (meskipun tidak semua pasien hadir sepanjang hari, tidak yakin apakah itu penting).
Saya ingin menggunakan lme4 dalam R untuk memodelkan struktur autoregresif dalam setiap pasien, tetapi beberapa Googling muncul dengan kutipan "lme4 tidak diatur untuk menangani struktur autoregresif". Bahkan jika itu, saya tidak yakin saya mengerti bagaimana menulis kode.
Kalau-kalau ada yang tahu, saya mengajukan pertanyaan seperti ini beberapa waktu yang lalu, mereka kumpulan data yang berbeda dengan masalah yang berbeda, meskipun sebenarnya memecahkan masalah ini akan membantu dengan yang itu (seseorang menyarankan saya menggunakan metode campuran sebelumnya, tetapi hal autoregresi ini telah membuat saya tidak yakin bagaimana melakukan ini).
Jadi saya agak macet dan kalah jujur. Setiap bantuan dengan penuh terima kasih diterima!
pgmm
dari paket plm tetapi karena variabel respons Anda adalah biner, saya tidak tahu persis bagaimana melakukannya. Mungkin orang lain dapat menguraikan ... (Dan ya Anda benar: pemahaman saya adalah setiap kali Anda memiliki variabel endogen, dalam hal ini nilai lagged, Anda tidak dapat menggunakan REML untuk memperkirakan karena bias, sehingga Anda perlu menggunakan GMM .)