Kejadian yang tidak biasa ketika berhadapan dengan model campuran maksimal yang kompleks (memperkirakan semua efek acak yang mungkin untuk data dan model yang diberikan) adalah sempurna (+1 atau -1) atau korelasi yang hampir sempurna di antara beberapa efek acak. Untuk tujuan diskusi, mari kita amati model dan ringkasan model berikut ini
Model: Y ~ X*Cond + (X*Cond|subj)
# Y = logit variable
# X = continuous variable
# Condition = values A and B, dummy coded; the design is repeated
# so all participants go through both Conditions
# subject = random effects for different subjects
Random effects:
Groups Name Variance Std.Dev. Corr
subject (Intercept) 0.85052 0.9222
X 0.08427 0.2903 -1.00
CondB 0.54367 0.7373 -0.37 0.37
X:CondB 0.14812 0.3849 0.26 -0.26 -0.56
Number of obs: 39401, groups: subject, 219
Fixed effects:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 2.49686 0.06909 36.14 < 2e-16 ***
X -1.03854 0.03812 -27.24 < 2e-16 ***
CondB -0.19707 0.06382 -3.09 0.00202 **
X:CondB 0.22809 0.05356 4.26 2.06e-05 ***
Alasan yang diduga di balik korelasi sempurna ini adalah bahwa kami telah menciptakan model yang terlalu rumit untuk data yang kami miliki. Saran umum yang diberikan dalam situasi ini adalah (misalnya, Matuschek et al., 2017; kertas ) untuk memperbaiki koefisien overparameter ke 0, karena model degenerasi seperti itu cenderung menurunkan daya. Jika kita mengamati perubahan nyata pada efek tetap dalam model yang diperkecil, kita harus menerimanya; jika tidak ada perubahan, maka tidak ada masalah dalam menerima yang asli.
Namun, mari kita asumsikan bahwa kita tidak hanya tertarik pada efek tetap yang dikendalikan untuk RE (efek acak), tetapi juga dalam struktur RE. Dalam kasus yang diberikan, secara teoritis akan masuk akal untuk mengasumsikan bahwa Intercept
dan lereng X
memiliki korelasi negatif bukan nol. Beberapa pertanyaan berikut:
Apa yang harus dilakukan dalam situasi seperti itu? Haruskah kita melaporkan korelasi sempurna dan mengatakan bahwa data kami tidak "cukup baik" untuk memperkirakan korelasi "nyata"? Atau haruskah kita melaporkan model korelasi 0? Atau haruskah kita mencoba menetapkan korelasi lain ke 0 dengan harapan bahwa yang "penting" tidak akan sempurna lagi? Saya rasa tidak ada 100% jawaban yang benar di sini, saya lebih suka mendengar pendapat Anda.
Bagaimana cara menulis kode yang memperbaiki korelasi 2 efek acak spesifik ke 0, tanpa mempengaruhi korelasi antara parameter lain?
blme
, MCMCglmm
, rstanarm
, brms
...)