Saya selalu diajarkan bahwa efek acak hanya memengaruhi varians (kesalahan), dan bahwa efek tetap hanya memengaruhi rata-rata. Tapi saya telah menemukan contoh di mana pengaruh acak juga mempengaruhi rata-rata - estimasi koefisien:
require(nlme)
set.seed(128)
n <- 100
k <- 5
cat <- as.factor(rep(1:k, each = n))
cat_i <- 1:k # intercept per kategorie
x <- rep(1:n, k)
sigma <- 0.2
alpha <- 0.001
y <- cat_i[cat] + alpha * x + rnorm(n*k, 0, sigma)
plot(x, y)
# simulate missing data
y[c(1:(n/2), (n*k-n/2):(n*k))] <- NA
m1 <- lm(y ~ x)
summary(m1)
m2 <- lm(y ~ cat + x)
summary(m2)
m3 <- lme(y ~ x, random = ~ 1|cat, na.action = na.omit)
summary(m3)
Anda dapat melihat bahwa koefisien estimasi untuk x
dari model m1
adalah -0.013780, sedangkan dari model m3
adalah 0,0011713 - keduanya berbeda secara signifikan dari nol.
Perhatikan bahwa ketika saya menghapus garis yang mensimulasikan data yang hilang, hasilnya sama (ini adalah matriks penuh).
Mengapa demikian?
PS: harap dicatat saya bukan ahli statistik profesional, jadi jika Anda akan merespons dengan banyak matematika maka harap buat juga beberapa ringkasan sederhana untuk boneka :-)
m2
itu juga berlaku (yang merupakan subjek dari pertanyaan lain )
m3
0,0011713" bukanm2
.