Saya mengerti bahwa kami menggunakan model efek acak (atau efek campuran) ketika kami percaya bahwa beberapa parameter model bervariasi secara acak di beberapa faktor pengelompokan. Saya memiliki keinginan untuk menyesuaikan model di mana respons telah dinormalisasi dan terpusat (tidak sempurna, tapi cukup dekat) di seluruh faktor pengelompokan, tetapi variabel independen x
belum disesuaikan dengan cara apa pun. Ini membawa saya ke tes berikut (menggunakan data palsu ) untuk memastikan bahwa saya akan menemukan efek yang saya cari jika memang ada. Saya menjalankan satu model efek campuran dengan intersep acak (lintas kelompok yang ditentukan oleh f
) dan model efek tetap kedua dengan faktor f sebagai prediktor efek tetap. Saya menggunakan paket R lmer
untuk model efek campuran, dan fungsi dasarlm()
untuk model efek tetap. Berikut ini adalah data dan hasilnya.
Perhatikan bahwa y
, terlepas dari grup, bervariasi di sekitar 0. Dan itu x
bervariasi secara konsisten dengan di y
dalam grup, tetapi berbeda jauh lebih banyak antar kelompok daripaday
> data
y x f
1 -0.5 2 1
2 0.0 3 1
3 0.5 4 1
4 -0.6 -4 2
5 0.0 -3 2
6 0.6 -2 2
7 -0.2 13 3
8 0.1 14 3
9 0.4 15 3
10 -0.5 -15 4
11 -0.1 -14 4
12 0.4 -13 4
Jika Anda tertarik bekerja dengan data, ini adalah dput()
output:
data<-structure(list(y = c(-0.5, 0, 0.5, -0.6, 0, 0.6, -0.2, 0.1, 0.4,
-0.5, -0.1, 0.4), x = c(2, 3, 4, -4, -3, -2, 13, 14, 15, -15,
-14, -13), f = structure(c(1L, 1L, 1L, 2L, 2L, 2L, 3L, 3L, 3L,
4L, 4L, 4L), .Label = c("1", "2", "3", "4"), class = "factor")),
.Names = c("y","x","f"), row.names = c(NA, -12L), class = "data.frame")
Menyesuaikan model efek campuran:
> summary(lmer(y~ x + (1|f),data=data))
Linear mixed model fit by REML
Formula: y ~ x + (1 | f)
Data: data
AIC BIC logLik deviance REMLdev
28.59 30.53 -10.3 11 20.59
Random effects:
Groups Name Variance Std.Dev.
f (Intercept) 0.00000 0.00000
Residual 0.17567 0.41913
Number of obs: 12, groups: f, 4
Fixed effects:
Estimate Std. Error t value
(Intercept) 0.008333 0.120992 0.069
x 0.008643 0.011912 0.726
Correlation of Fixed Effects:
(Intr)
x 0.000
Saya perhatikan bahwa komponen varians intersep diperkirakan 0, dan yang penting bagi saya, x
bukan merupakan prediktor signifikan y
.
Selanjutnya saya cocok dengan model efek tetap dengan f
sebagai prediktor dan bukan faktor pengelompokan untuk intersep acak:
> summary(lm(y~ x + f,data=data))
Call:
lm(formula = y ~ x + f, data = data)
Residuals:
Min 1Q Median 3Q Max
-0.16250 -0.03438 0.00000 0.03125 0.16250
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -1.38750 0.14099 -9.841 2.38e-05 ***
x 0.46250 0.04128 11.205 1.01e-05 ***
f2 2.77500 0.26538 10.457 1.59e-05 ***
f3 -4.98750 0.46396 -10.750 1.33e-05 ***
f4 7.79583 0.70817 11.008 1.13e-05 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.1168 on 7 degrees of freedom
Multiple R-squared: 0.9484, Adjusted R-squared: 0.9189
F-statistic: 32.16 on 4 and 7 DF, p-value: 0.0001348
Sekarang saya perhatikan bahwa, seperti yang diharapkan, x
adalah prediktor signifikan y
.
Apa yang saya cari adalah intuisi mengenai perbedaan ini. Dalam hal apa pemikiran saya salah di sini? Mengapa saya salah berharap untuk menemukan parameter yang signifikan untuk x
di kedua model ini tetapi hanya benar-benar melihatnya dalam model efek tetap?
x
variabel tidak signifikan. Saya menduga itu adalah hasil yang sama (koefisien dan SE) yang akan Anda jalankanlm(y~x,data=data)
. Tidak punya waktu lagi untuk mendiagnosis, tetapi ingin menunjukkan ini.