Ini lebih merupakan pertanyaan konseptual, tetapi karena saya menggunakan R
saya akan merujuk ke paket di R
. Jika tujuannya adalah agar sesuai dengan model linier untuk keperluan prediksi, dan kemudian membuat prediksi di mana efek acak mungkin tidak tersedia, apakah ada manfaat menggunakan model efek campuran, atau haruskah model efek tetap digunakan sebagai gantinya?
Sebagai contoh, jika saya memiliki data tentang berat vs tinggi dengan beberapa informasi lain, dan membuat model dengan menggunakan lme4
, di mana subjek adalah faktor dengan level ( ):
mod1 <- lmer(weight ~ height + age + (1|subject), data=df, REML=F)
Lalu saya ingin dapat memprediksi berat dari model menggunakan tinggi dan umur data baru. Jelas varians menurut subjek dalam data asli ditangkap dalam model, tetapi apakah mungkin untuk menggunakan informasi ini dalam prediksi? Katakanlah saya memiliki beberapa data tinggi dan usia baru, dan ingin memprediksi berat, saya dapat melakukannya sebagai berikut:
predict(mod1,newdata=newdf) # newdf columns for height, age, subject
Ini akan digunakan predict.merMod
, dan saya bisa memasukkan kolom untuk subjek (baru) di newdf
, atau mengatur re.form =~0
. Pada contoh pertama, tidak jelas apa yang dilakukan model dengan faktor-faktor subjek 'baru', dan dalam contoh kedua, akankah variasi menurut subjek yang ditangkap dalam model diabaikan begitu saja (dirata-rata lebih) untuk prediksi?
Dalam kedua kasus itu tampak bagi saya bahwa model linear efek tetap mungkin lebih tepat. Memang, jika pemahaman saya benar, maka model efek tetap harus memprediksi nilai yang sama dengan model campuran, jika efek acak tidak digunakan dalam prediksi. Haruskah ini masalahnya? Di R
dalamnya tidak, misalnya:
mod1 <- lmer(weight ~ height + age + (1|subject), data=df, REML=F)
predict(mod1,newdata=newdf, re.form=~0) # newdf columns for height, age, subject
menghasilkan hasil yang berbeda untuk:
mod2 <- lm(weight ~ height + age, data=df)
predict(mod2,newdata=newdf) # newdf columns for height, age