Cara memperkirakan komponen varians dengan lmer untuk model dengan efek acak dan membandingkannya dengan hasil lme


14

Saya melakukan percobaan di mana saya membesarkan keluarga yang berbeda yang berasal dari dua populasi sumber yang berbeda. Setiap keluarga diberi satu dari dua perawatan. Setelah percobaan saya mengukur beberapa sifat pada setiap individu. Untuk menguji efek dari salah satu perlakuan atau sumber serta interaksi mereka, saya menggunakan model efek campuran linier dengan keluarga sebagai faktor acak, yaitu

lme(fixed=Trait~Treatment*Source,random=~1|Family,method="ML")

sejauh ini bagus, Sekarang saya harus menghitung komponen varians relatif, yaitu persentase variasi yang dijelaskan oleh perlakuan atau sumber serta interaksi.

Tanpa efek acak, saya dapat dengan mudah menggunakan jumlah kuadrat (SS) untuk menghitung varians yang dijelaskan oleh masing-masing faktor. Tetapi untuk model campuran (dengan estimasi ML), tidak ada SS, maka saya pikir saya bisa menggunakan Pengobatan dan Sumber sebagai efek acak juga untuk memperkirakan varians, yaitu

lme(fixed=Trait~1,random=~(Treatment*Source)|Family, method="REML")

Namun, dalam beberapa kasus, lme tidak konvergen, maka saya menggunakan lmer dari paket lme4:

lmer(Trait~1+(Treatment*Source|Family),data=DATA)

Di mana saya mengekstrak varians dari model menggunakan fungsi ringkasan:

model<-lmer(Trait~1+(Treatment*Source|Family),data=regrexpdat)
results<-VarCorr(model)
variances<-results[,3]

Saya mendapatkan nilai yang sama dengan fungsi VarCorr. Saya kemudian menggunakan nilai-nilai ini untuk menghitung persentase aktual dari variasi mengambil jumlah sebagai variasi total.

Di mana saya berjuang adalah dengan interpretasi hasil dari model lme awal (dengan pengobatan dan sumber sebagai efek tetap) dan model acak untuk memperkirakan komponen varians (dengan perlakuan dan sumber sebagai efek acak). Saya menemukan dalam kebanyakan kasus bahwa persentase perbedaan yang dijelaskan oleh masing-masing faktor tidak sesuai dengan signifikansi dari efek tetap.

Misalnya untuk sifat HD, lme awal menunjukkan kecenderungan untuk interaksi serta pentingnya pengobatan. Menggunakan prosedur mundur, saya menemukan bahwa Pengobatan memiliki kecenderungan yang signifikan. Namun, memperkirakan komponen varians, saya menemukan bahwa Sumber memiliki varian tertinggi, membuat hingga 26,7% dari total varian.

Lme:

anova(lme(fixed=HD~as.factor(Treatment)*as.factor(Source),random=~1|as.factor(Family),method="ML",data=test),type="m")
                                      numDF denDF  F-value p-value
(Intercept)                                1   426 0.044523  0.8330
as.factor(Treatment)                       1   426 5.935189  0.0153
as.factor(Source)                          1    11 0.042662  0.8401
as.factor(Treatment):as.factor(Source)     1   426 3.754112  0.0533

Dan si lemah:

summary(lmer(HD~1+(as.factor(Treatment)*as.factor(Source)|Family),data=regrexpdat))
Linear mixed model fit by REML 
Formula: HD ~ 1 + (as.factor(Treatment) * as.factor(Source) | Family) 
   Data: regrexpdat 
    AIC    BIC logLik deviance REMLdev
 -103.5 -54.43  63.75   -132.5  -127.5
Random effects:
 Groups   Name                                      Variance  Std.Dev. Corr                 
 Family   (Intercept)                               0.0113276 0.106431                      
          as.factor(Treatment)                      0.0063710 0.079819  0.405               
          as.factor(Source)                         0.0235294 0.153393 -0.134 -0.157        
          as.factor(Treatment)L:as.factor(Source)   0.0076353 0.087380 -0.578 -0.589 -0.585 
 Residual                                           0.0394610 0.198648                      
Number of obs: 441, groups: Family, 13

Fixed effects:
            Estimate Std. Error t value
(Intercept) -0.02740    0.03237  -0.846

Maka pertanyaan saya adalah, apakah benar apa yang saya lakukan? Atau haruskah saya menggunakan cara lain untuk memperkirakan jumlah varians yang dijelaskan oleh masing-masing faktor (yaitu Pengobatan, Sumber dan interaksinya). Misalnya, apakah ukuran efek akan menjadi cara yang lebih tepat?


Faktor pengobatan memiliki 40x derajat kebebasan sebagai faktor sumber (pseudoreplication?). Ini tidak diragukan lagi menurunkan nilai P pengobatan.

Jawaban:


1

Salah satu cara umum untuk menentukan kontribusi relatif dari masing-masing faktor ke model adalah dengan menghapus faktor dan membandingkan kemungkinan relatif dengan sesuatu seperti tes chi-squared:

pchisq(logLik(model1) - logLik(model2), 1)

Karena cara menghitung kemungkinan antara fungsi mungkin sedikit berbeda, saya biasanya hanya akan membandingkannya antara metode yang sama.


1
bukankah seharusnya begitu 1-pchisq(logLik(model1) - logLik(model2), 1)?
user81411
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.