Saya ingin menyesuaikan model campuran menggunakan lme4, nlme, paket regresi baysian atau yang tersedia.
Model campuran dalam konvensi pengkodean Asreml-R
sebelum membahas secara spesifik, kami mungkin ingin memiliki detail tentang konvensi asreml-R, bagi mereka yang tidak terbiasa dengan kode ASREML.
y = Xτ + Zu + e ........................(1) ;
model campuran biasa dengan, y menunjukkan vektor pengamatan n × 1, di mana τ adalah vektor p × 1 dari efek tetap, X adalah matriks desain n × p dari peringkat kolom penuh yang menghubungkan pengamatan dengan kombinasi yang tepat dari efek tetap , u adalah vektor q × 1 dari efek acak, Z adalah matriks desain n × q yang mengaitkan pengamatan dengan kombinasi yang tepat dari efek acak, dan e adalah vektor n × 1 dari kesalahan residu. Model (1) disebut model campuran linier atau model efek campuran linier. Diasumsikan
di mana matriks G dan R adalah fungsi dari parameter γ dan φ, masing-masing.
Parameter θ adalah parameter varians yang akan kita sebut sebagai parameter skala.
Dalam model efek campuran dengan lebih dari satu varians residual, timbul misalnya dalam analisis data dengan lebih dari satu bagian atau variate, parameter θ diikat menjadi satu. Dalam model efek campuran dengan varians residual tunggal maka θ sama dengan varians residual (σ2). Dalam hal ini R harus berupa matriks korelasi. Rincian lebih lanjut tentang model disediakan dalam manual Asreml (tautan) .
Struktur varians untuk kesalahan: Struktur R dan struktur Varians untuk efek acak: struktur G dapat ditentukan.
pemodelan varians dalam asreml () penting untuk memahami pembentukan struktur varians melalui produk langsung. Asumsi kuadrat terkecil yang biasa (dan default di asreml ()) adalah bahwa ini terdistribusi secara independen dan identik (IID). Namun, jika data berasal dari percobaan lapangan yang ditata dalam array persegi dari baris dengan c kolom, katakanlah, kita dapat mengatur residu sebagai matriks dan berpotensi mempertimbangkan bahwa mereka secara otomatis berkorelasi dalam baris dan kolom. Menulis residu sebagai vektor dalam urutan lapangan, yaitu, dengan mengurutkan baris residual dalam kolom (plot dalam blok) varians dari residual kemudian
adalah matriks korelasi untuk model baris (urutan r, parameter autokorelasi ½r) dan model kolom (urutan c, parameter autokorelasi ½c). Lebih khusus, struktur spasial autoregresif dua dimensi yang dapat dipisah (AR1 x AR1) kadang-kadang diasumsikan untuk kesalahan umum dalam analisis uji coba lapangan.
Contoh data:
nin89 berasal dari perpustakaan asreml-R, di mana berbagai varietas ditanam dalam replikasi / blok di bidang persegi panjang. Untuk mengontrol variabilitas tambahan dalam arah baris atau kolom, setiap plot direferensikan sebagai variabel Baris dan Kolom (desain kolom baris). Dengan demikian desain kolom baris ini dengan pemblokiran. Yield adalah variabel yang diukur.
Contoh model
Saya membutuhkan sesuatu yang setara dengan kode asreml-R:
Sintaks model sederhana akan terlihat seperti berikut:
rcb.asr <- asreml(yield ∼ Variety, random = ∼ Replicate, data = nin89)
.....model 0
Model linier ditentukan dalam argumen tetap (wajib), acak (opsional) dan rcov (komponen kesalahan) sebagai objek rumus. Default adalah istilah kesalahan sederhana dan tidak perlu ditentukan secara formal untuk istilah kesalahan seperti dalam model 0 .
di sini variasi adalah efek tetap dan acak adalah ulangan (blok). Selain istilah acak dan tetap, kami dapat menentukan istilah kesalahan. Yang merupakan default dalam model ini 0. Komponen residual atau kesalahan model ditentukan dalam objek rumus melalui argumen rcov, lihat model berikut 1: 4.
Model1 berikut ini lebih kompleks di mana struktur G (acak) dan R (kesalahan) ditentukan.
Model 1:
data(nin89)
# Model 1: RCB analysis with G and R structure
rcb.asr <- asreml(yield ~ Variety, random = ~ idv(Replicate),
rcov = ~ idv(units), data = nin89)
Model ini setara dengan model 0 di atas, dan memperkenalkan penggunaan model varians G dan R. Di sini opsi acak dan rcov menentukan rumus acak dan rcov untuk secara eksplisit menentukan struktur G dan R. di mana idv () adalah fungsi model khusus di asreml () yang mengidentifikasi model varians. Ekspresi idv (units) secara eksplisit menetapkan matriks varians untuk e ke identitas yang diskalakan.
# Model 2: model spasial dua dimensi dengan korelasi satu arah
sp.asr <- asreml(yield ~ Variety, rcov = ~ Column:ar1(Row), data = nin89)
unit eksperimental dari nin89 diindeks oleh Kolom dan Baris. Jadi kami mengharapkan variasi acak dalam dua arah - baris dan arah kolom dalam kasus ini. di mana ar1 () adalah fungsi khusus yang menentukan model varians autoregresif orde pertama untuk Row. Panggilan ini menentukan struktur spasial dua dimensi untuk kesalahan tetapi dengan korelasi spasial dalam arah baris saja. Model varians untuk Kolom adalah identitas (id ()) tetapi tidak perlu ditentukan secara formal karena ini adalah default.
# model 3: model spasial dua dimensi, struktur kesalahan di kedua arah
sp.asr <- asreml(yield ~ Variety, rcov = ~ ar1(Column):ar1(Row),
data = nin89)
sp.asr <- asreml(yield ~ Variety, random = ~ units,
rcov = ~ ar1(Column):ar1(Row), data = nin89)
mirip dengan model 2 di atas, namun korelasinya dua arah - autoregresif.
Saya tidak yakin berapa banyak model ini mungkin dengan paket R open source. Sekalipun solusi salah satu dari model ini akan sangat membantu. Bahkan jika pertarungan +50 dapat merangsang untuk mengembangkan paket seperti itu akan sangat membantu!
Lihat MAYSaseen telah memberikan output dari setiap model dan data (sebagai jawaban) untuk perbandingan.
Suntingan: Berikut ini adalah saran yang saya terima di forum diskusi model campuran: "Anda mungkin melihat paket regresi dan tata ruang David Clifford. Yang pertama memungkinkan pemasangan model campuran (Gaussian) di mana Anda dapat menentukan struktur matriks kovarians dengan sangat fleksibel (misalnya, saya telah menggunakannya untuk data silsilah). Paket spatialCovariance menggunakan regresi untuk memberikan model yang lebih rumit daripada AR1xAR1, tetapi mungkin berlaku. Anda mungkin harus berkorespondensi dengan penulis tentang penerapannya pada masalah Anda yang sebenarnya. "
corStruct
dalam nlme
(untuk korelasi anisotropik) ... Ini akan membantu jika Anda dapat secara singkat menyatakan (dalam kata-kata atau persamaan) model statistik yang sesuai dengan pernyataan ASREML ini, karena kita tidak semua akrab dengan Sintaks ASREML ...
MCMCglmm
, dan saya cukup yakin bahwa (selain yang spatialCovariance
disebutkan, yang saya tidak terbiasa dengan) satu-satunya cara untuk menyelesaikannya dalam R adalah dengan mendefinisikan baru corStruct
s - yang mungkin, tapi tidak sepele.
lme4
. Bisakah Anda (a) memberi tahu kami mengapa Anda perlu melakukan inilme4
daripadaasreml-R
(b) mempertimbangkan memposting dir-sig-mixed-models
mana ada keahlian yang lebih relevan?