Dua tahun data yang menggambarkan terjadinya hubungan pengujian kekerasan dengan jumlah pasien di bangsal

Saya memiliki dua tahun data yang pada dasarnya terlihat seperti ini:

Tanggal _ __ Kekerasan Y / T? _ Jumlah pasien

1/1/2008 _ ___ 0 __ _ __ _ ____ 11

2/1/2008 _ __ _ 0 _ __ _ __ _ __ 11

3/1/2008 _ ____ 1 __ _ __ _ ____ 12

4/1/2008 _ ____ 0 __ _ __ _ ____ 12

...

31/12 / 2009_ _ __ 0_ _ __ _ __ _ __ 14

yaitu dua tahun pengamatan, satu per hari, dari bangsal psikiatrik, yang menunjukkan apakah ada insiden kekerasan pada hari itu (1 adalah ya, 0 tidak) serta jumlah pasien di bangsal. Hipotesis yang ingin kami uji adalah bahwa lebih banyak pasien di bangsal dikaitkan dengan peningkatan kemungkinan kekerasan di bangsal.

Kami menyadari, tentu saja, bahwa kami harus menyesuaikan kenyataan bahwa ketika ada lebih banyak pasien di bangsal, kekerasan lebih mungkin karena ada lebih banyak dari mereka - kami tertarik pada apakah kemungkinan masing-masing individu dari kekerasan meningkat ketika ada lebih banyak pasien di bangsal.

Saya telah melihat beberapa makalah yang hanya menggunakan regresi logistik, tetapi saya pikir itu salah karena ada struktur autoregresif (walaupun, melihat fungsi autokorelasi, ia tidak mendapatkan di atas 0,1 pada setiap lag, meskipun ini di atas Garis putus-putus biru "signifikan" yang menarik R untuk saya).

Hanya untuk membuat segalanya menjadi lebih rumit, saya bisa jika saya ingin memecah hasilnya menjadi masing-masing pasien, sehingga data akan terlihat sama seperti di atas, kecuali saya akan memiliki data untuk setiap pasien, 1/1/2008, 2 / 1/2008 dll. Dan kode ID mengarah ke samping sehingga data akan menunjukkan seluruh riwayat insiden untuk setiap pasien secara terpisah (meskipun tidak semua pasien hadir sepanjang hari, tidak yakin apakah itu penting).

Saya ingin menggunakan lme4 dalam R untuk memodelkan struktur autoregresif dalam setiap pasien, tetapi beberapa Googling muncul dengan kutipan "lme4 tidak diatur untuk menangani struktur autoregresif". Bahkan jika itu, saya tidak yakin saya mengerti bagaimana menulis kode.

Kalau-kalau ada yang tahu, saya mengajukan pertanyaan seperti ini beberapa waktu yang lalu, mereka kumpulan data yang berbeda dengan masalah yang berbeda, meskipun sebenarnya memecahkan masalah ini akan membantu dengan yang itu (seseorang menyarankan saya menggunakan metode campuran sebelumnya, tetapi hal autoregresi ini telah membuat saya tidak yakin bagaimana melakukan ini).

Jadi saya agak macet dan kalah jujur. Setiap bantuan dengan penuh terima kasih diterima!

r mixed-model autocorrelation panel-data

— Chris Beeley
sumber

Saya berurusan dengan masalah yang sama, saya kira Anda dapat menggunakan pgmmdari paket plm tetapi karena variabel respons Anda adalah biner, saya tidak tahu persis bagaimana melakukannya. Mungkin orang lain dapat menguraikan ... (Dan ya Anda benar: pemahaman saya adalah setiap kali Anda memiliki variabel endogen, dalam hal ini nilai lagged, Anda tidak dapat menggunakan REML untuk memperkirakan karena bias, sehingga Anda perlu menggunakan GMM .)

— penggoda

Berikut adalah ide yang menghubungkan variabel dependen biner Anda ke variabel kontinu, tidak teramati; koneksi yang memungkinkan Anda memanfaatkan kekuatan model deret waktu untuk variabel kontinu.

Menetapkan:

$V_{w,t} = 1$ jika insiden kekerasan terjadi di bangsal selama periode waktu dan 0 sebaliknya $w$ $t$

$P_{w,t}$ : Kecenderungan untuk kekerasan di bangsal pada waktu . $w$ $t$

$P_{w,t}$ diasumsikan sebagai variabel kontinu yang dalam beberapa hal mewakili perasaan 'terpendam' dari narapidana yang mendidih pada suatu waktu dan menghasilkan kekerasan. Mengikuti alasan ini, kami memiliki:

$V_{w,t} = \begin{cases} 1 & \mbox{if } P_{w,t} \ge \tau \\ 0 & \mbox{otherwise} \end{cases}$

dimana,

$\tau$ adalah ambang tidak teramati yang memicu tindakan kekerasan.

Anda kemudian dapat menggunakan model deret waktu untuk dan memperkirakan parameter yang relevan. Misalnya, Anda dapat memodelkan sebagai: $P_{w,t}$ $P_{w,t}$

$P_{w,t} = \alpha_0 + \alpha_1 P_{w,t-1} + ... + \alpha_p P_{w,t-p}+ \beta n_{w,t} + \epsilon_t$

dimana,

$n_{w,t}$ adalah jumlah pasien di bangsal pada waktu . $w$ $t$

Anda dapat melihat apakah berbeda secara signifikan dari 0 untuk menguji hipotesis Anda bahwa "lebih banyak pasien mengarah pada peningkatan kemungkinan kekerasan". $\beta$

Tantangan dari spesifikasi model di atas adalah Anda tidak benar-benar mengamati dan dengan demikian di atas bukan model deret waktu Anda yang biasa. Saya tidak tahu apa-apa tentang R jadi mungkin orang lain akan chip jika ada paket yang akan membiarkan Anda memperkirakan model seperti di atas. $P_{w,t}$