Berbagai deskripsi tentang pemilihan model pada efek acak dari Linear Mixed Models memerintahkan untuk menggunakan REML. Saya tahu perbedaan antara REML dan ML pada tingkat tertentu, tetapi saya tidak mengerti mengapa REML harus digunakan karena ML bias. Misalnya, apakah salah menjalankan LRT pada parameter varians dari model distribusi normal menggunakan ML (lihat kode di bawah)? Saya tidak mengerti mengapa lebih penting untuk tidak memihak daripada menjadi ML, dalam pemilihan model. Saya pikir jawabannya adalah "karena pemilihan model bekerja lebih baik dengan REML daripada dengan ML" tetapi saya ingin tahu sedikit lebih banyak dari itu. Saya tidak membaca derivasi LRT dan AIC (saya tidak cukup baik untuk memahaminya secara menyeluruh), tetapi jika REML secara eksplisit digunakan dalam derivasi, hanya mengetahui bahwa itu akan cukup memadai (misalnya,
n <- 100
a <- 10
b <- 1
alpha <- 5
beta <- 1
x <- runif(n,0,10)
y <- rnorm(n,a+b*x,alpha+beta*x)
loglik1 <- function(p,x,y){
a <- p[1]
b <- p[2]
alpha <- p[3]
-sum(dnorm(y,a+b*x,alpha,log=T))
}
loglik2 <- function(p,x,y){
a <- p[1]
b <- p[2]
alpha <- p[3]
beta <- p[4]
-sum(dnorm(y,a+b*x,alpha+beta*x,log=T))
}
m1 <- optim(c(a,b,alpha),loglik1,x=x,y=y)$value
m2 <- optim(c(a,b,alpha,beta),loglik2,x=x,y=y)$value
D <- 2*(m1-m2)
1-pchisq(D,df=1) # p-value