Mudah-mudahan ini adalah pertanyaan yang seseorang di sini dapat menjawab untuk saya tentang sifat dekomposisi jumlah kuadrat dari model efek campuran cocok dengan lmer
(dari paket lme4 R).
Pertama saya harus mengatakan bahwa saya menyadari kontroversi dengan menggunakan pendekatan ini, dan dalam praktiknya saya akan lebih cenderung menggunakan LRT bootstrap untuk membandingkan model (seperti yang disarankan oleh Faraway, 2006). Namun, saya bingung bagaimana mereplikasi hasil, dan jadi untuk kewarasan saya sendiri saya pikir saya akan bertanya di sini.
Pada dasarnya, saya mulai terbiasa menggunakan model efek campuran yang sesuai dengan lme4
paket. Saya tahu bahwa Anda dapat menggunakan anova()
perintah untuk memberikan ringkasan pengujian efek tetap dalam model secara berurutan. Sejauh yang saya tahu ini adalah apa yang Faraway (2006) sebut sebagai pendekatan 'kotak Rata-rata yang diharapkan'. Yang ingin saya ketahui adalah bagaimana jumlah kuadrat dihitung?
Saya tahu bahwa saya dapat mengambil nilai estimasi dari model tertentu (menggunakan coef()
), berasumsi bahwa mereka sudah diperbaiki, dan kemudian melakukan tes menggunakan jumlah kuadrat residual model dengan dan tanpa faktor-faktor yang menarik. Ini bagus untuk model yang mengandung faktor dalam-subjek tunggal. Namun, ketika menerapkan desain petak-petak, jumlah nilai kuadrat yang saya dapatkan setara dengan nilai yang dihasilkan oleh R aov()
dengan Error()
peruntukan yang sesuai . Namun, ini tidak sama dengan jumlah kuadrat yang dihasilkan oleh anova()
perintah pada objek model, terlepas dari kenyataan bahwa rasio-F adalah sama.
Tentu saja ini masuk akal karena tidak perlu untuk Error()
strata dalam model campuran. Namun, ini harus berarti bahwa jumlah kuadrat dihukum entah bagaimana dalam model campuran untuk memberikan rasio-F yang tepat. Bagaimana ini dicapai? Dan bagaimana model tersebut entah bagaimana mengoreksi jumlah kuadrat antar-plot tetapi tidak mengoreksi jumlah kuadrat dalam-plot. Jelas ini adalah sesuatu yang diperlukan untuk ANOVA split-plot klasik yang dicapai dengan merancang nilai kesalahan yang berbeda untuk efek yang berbeda, jadi bagaimana model efek campuran memungkinkan untuk ini?
Pada dasarnya, saya ingin dapat mereplikasi hasil dari anova()
perintah yang diterapkan pada objek model lmer sendiri untuk memverifikasi hasil dan pemahaman saya, namun, saat ini saya dapat mencapai ini untuk desain dalam-subjek normal tetapi tidak untuk pemisahan. desain plot dan sepertinya saya tidak tahu mengapa ini terjadi.
Sebagai contoh:
library(faraway)
library(lme4)
data(irrigation)
anova(lmer(yield ~ irrigation + variety + (1|field), data = irrigation))
Analysis of Variance Table
Df Sum Sq Mean Sq F value
irrigation 3 1.6605 0.5535 0.3882
variety 1 2.2500 2.2500 1.5782
summary(aov(yield ~ irrigation + variety + Error(field/irrigation), data = irrigation))
Error: field
Df Sum Sq Mean Sq F value Pr(>F)
irrigation 3 40.19 13.40 0.388 0.769
Residuals 4 138.03 34.51
Error: Within
Df Sum Sq Mean Sq F value Pr(>F)
variety 1 2.25 2.250 1.578 0.249
Residuals 7 9.98 1.426
Seperti dapat dilihat di atas, semua rasio-F setuju. Jumlah kuadrat untuk varietas juga setuju. Namun, jumlah kuadrat untuk irigasi tidak setuju, namun tampaknya output yang lebih kecil diskalakan. Jadi, apa sebenarnya yang dilakukan perintah anova ()?
mixed()
dariafex
yang menawarkan apa yang Anda inginkan (viamethod = "PB"
). Dan karena Anda jelas telah melakukan beberapa pengujian dengan data mainan, pasti akan sangat membantu jika Anda dapat menunjukkan kesetaraan tersebut dengan data dan kode (karenanya, tidak ada +1).