Pertanyaan tentang menentukan model campuran linier dalam R untuk data tindakan berulang dengan struktur bersarang tambahan

Struktur data

> str(data)
 'data.frame':   6138 obs. of  10 variables:
 $ RT     : int  484 391 422 516 563 531 406 500 516 578 ...
 $ ASCORE : num  5.1 4 3.8 2.6 2.7 6.5 4.9 2.9 2.6 7.2 ...
 $ HSCORE : num  6 2.1 7.9 1 6.9 8.9 8.2 3.6 1.7 8.6 ...
 $ MVMNT  : Factor w/ 2 levels "_Withd","Appr": 2 2 1 1 2 1 2 1 1 2 ...
 $ STIM   : Factor w/ 123 levels " arti"," cele",..: 16 23 82 42 105 4 93 9 34 25 ...
 $ DRUG   : Factor w/ 2 levels "Inactive","Pharm": 1 1 1 1 1 1 1 1 1 1 ...
 $ FULLNSS: Factor w/ 2 levels "Fasted","Fed": 2 2 2 2 2 2 2 2 2 2 ...
 $ PATIENT: Factor w/ 25 levels "Subj01","Subj02",..: 1 1 1 1 1 1 1 1 1 1 ...
 $ SESSION: Factor w/ 4 levels "Sess1","Sess2",..: 1 1 1 1 1 1 1 1 1 1 ...
 $ TRIAL  : Factor w/ 6138 levels "T0001","T0002",..: 1 2 3 4 5 6 7 8 9 10 ...

Calon Model Lengkap

model.loaded.fit <- lmer(RT ~ ASCORE*HSCORE*MVMNT*DRUG*FULLNSS
                              + (1|PATIENT) + (1|SESSION), data, REML = TRUE)

Waktu reaksi dari percobaan dikelompokkan dalam sesi, yang pada gilirannya dikelompokkan dalam pasien
Setiap percobaan dapat dikarakteristikkan dengan dua kovariat berkelanjutan dari ASCORE dan HSCORE (berkisar antara 1-9) dan oleh respon gerakan (penarikan atau pendekatan)
Sesi ditandai dengan asupan obat (plasebo atau pharmacon aktif) dan oleh kepenuhan (puasa atau pra-makan)

Pemodelan dan Sintaks R?

Saya mencoba menentukan model lengkap yang sesuai dengan struktur rata-rata yang dimuat yang dapat digunakan sebagai titik awal dalam strategi pemilihan model top-down.

Masalah spesifik:

Apakah sintaksis menentukan dengan benar efek pengelompokan dan acak?
Selain sintaks, apakah model ini sesuai untuk desain dalam-subjek di atas?
Haruskah model lengkap menentukan semua interaksi efek tetap, atau hanya interaksi yang benar-benar saya minati?
Saya belum memasukkan faktor STIM dalam model, yang mencirikan jenis stimulus spesifik yang digunakan dalam percobaan, tetapi yang saya tidak tertarik untuk memperkirakannya dengan cara apa pun - haruskah saya menentukan bahwa sebagai faktor acak mengingat faktor STIM memiliki 123 level dan sangat sedikit titik data per jenis stimulus?

— Cel
sumber

jika saya tidak dapat menemukan saran di sini saya benar-benar tidak tahu siapa yang bisa saya tanyakan? mungkin Anda tahu ada forum model campuran khusus atau bahkan seorang ahli yang bersedia berkonsultasi untuk sedikit uang?

— Cel

Hai @Cel, sepertinya Anda memiliki SEMUA interaksi dalam model, termasuk interaksi 5 arah, 4 arah, dan 3 arah. Saya tidak yakin tentang kasus ini, tetapi itu biasanya akan sangat melengkapi data, yang akan membuat hasil Anda kurang digeneralisasikan. Pemilihan mundur (jika Anda harus menggunakannya) tidak perlu memulai dengan model yang sepenuhnya jenuh - itu harus dimulai dengan model terbesar yang Anda anggap masuk akal. Bisakah Anda mengurangi itu sama sekali?

— Makro

@ Macro senang mengetahui, saya hanya akan menyertakan interaksi yang tampaknya masuk akal. apakah Anda memiliki saran mengenai masalah lain? jika Anda melakukannya, mungkin masukkan itu sebagai jawaban agar saya bisa menerimanya.

— Cel

Saya akan menjawab setiap pertanyaan Anda secara bergantian.

Apakah sintaksis menentukan dengan benar efek pengelompokan dan acak?

Model yang Anda muat di sini adalah, dalam istilah matematika, model

Y_{i j k} = X_{i j k} β + η_{i} + θ_{i j} + ε_{i j k}

$Y_{ijk} = {\bf X}_{ijk} {\boldsymbol \beta} + \eta_{i} + \theta_{ij} + \varepsilon_{ijk}$

dimana

$Y_{ijk}$ $k$ $j$ $i$
${\bf X}_{ijk}$ $k$ $j$ $i$
$\eta_i$ $i$ $\theta_{ij}$ $i$ $j$ $\varepsilon_{ijk}$
${\boldsymbol \beta}$

Sebagaimana dicatat pada halaman 14-15 di sini model ini benar untuk menentukan bahwa sesi bersarang dalam individu, yang merupakan kasus dari deskripsi Anda.

Selain sintaks, apakah model ini sesuai untuk desain dalam-subjek di atas?

${\bf X}_{ijk} {\boldsymbol \beta}$

Haruskah model lengkap menentukan semua interaksi efek tetap, atau hanya interaksi yang benar-benar saya minati?

Saya pikir memulai dengan model yang sangat jenuh mungkin bukan ide yang bagus, kecuali itu masuk akal secara substansial. Seperti yang saya katakan dalam komentar, ini akan cenderung melebihi set data khusus Anda dan dapat membuat hasil Anda kurang digeneralisasikan. Mengenai pemilihan model, jika Anda mulai dengan model yang benar-benar jenuh dan melakukan seleksi mundur ( yang oleh beberapa orang di situs ini, dengan alasan yang bagus, keberatan ) maka Anda harus memastikan untuk menghormati hierarki dalam model. Artinya, jika Anda menghilangkan interaksi tingkat yang lebih rendah dari model, maka Anda juga harus menghapus semua interaksi tingkat yang lebih tinggi yang melibatkan variabel itu. Untuk diskusi lebih lanjut tentang itu, lihat utas tertaut.

Saya belum memasukkan faktor STIM dalam model, yang mencirikan jenis stimulus spesifik yang digunakan dalam percobaan, tetapi yang saya tidak tertarik untuk memperkirakannya dengan cara apa pun - haruskah saya menentukan bahwa sebagai faktor acak mengingat faktor STIM memiliki 123 level dan sangat sedikit titik data per jenis stimulus?

Diakui tidak tahu apa-apa tentang aplikasi (jadi ambil ini dengan sebutir garam), yang terdengar seperti efek tetap, bukan efek acak. Artinya, jenis perawatan terdengar seperti variabel yang akan sesuai dengan perubahan tetap dalam respon rata-rata, bukan sesuatu yang akan menginduksi korelasi antara subyek yang memiliki jenis stimulus yang sama. Tapi, fakta bahwa itu adalah faktor level 123 membuatnya sulit untuk masuk ke dalam model. Saya kira saya ingin tahu seberapa besar efek yang Anda harapkan dari efek ini. Terlepas dari ukuran efeknya, itu tidak akan menyebabkan bias dalam perkiraan kemiringan Anda karena ini adalah model linier, tetapi meninggalkannya dapat membuat kesalahan standar Anda lebih besar daripada yang seharusnya.

— Makro
sumber

Wow. Makro terima kasih, saya berharap saya bisa memberikan lebih banyak poin.

— Cel

η_{i}

$\eta_{i}$

θ_{j}

$\theta_{j}$

θ_{j}

$\theta_{j}$