Saya telah menjelajahi banyak situs bantuan dan masih bingung tentang cara menentukan istilah bersarang yang lebih rumit dalam model campuran juga. Saya juga bingung karena penggunaan :
dan /
dan |
dalam menentukan interaksi dan bersarang dengan faktor acak yang digunakan lmer()
dalam lme4
paket di R
.
Untuk keperluan pertanyaan ini, anggap saya telah secara akurat menggambarkan data saya dengan model statistik standar ini: diperbaiki, dan acak. (secara implisit) bersarang di dalam .
station
tow
day
Tow
station
Dengan kata lain, saya berharap bahwa model saya mencakup Station (i, fix), Tow (j, acak, secara implisit bersarang di dalam Station), Hari (k, acak), dan interaksi antara Tow dan Day, dan interaksi antara Day dan Stasiun. Saya telah berkonsultasi dengan ahli statistik untuk membuat model saya dan saat ini percaya bahwa itu mewakili data saya, tetapi juga akan menambahkan deskripsi data saya untuk mereka yang tertarik di bagian bawah posting saya agar tidak berantakan.
Sejauh ini yang bisa saya himpun adalah sebagai berikut lmer
:
lmer(y ~ station + (1|station:tow) + (1|Day) + (1|station:day) + (1|tow:day),
data=my.data)
Apakah ini menggambarkan model statistik saya secara akurat? Adakah saran untuk meningkatkan kode saya jika tidak dibaca dengan benar?
Saya sudah berani istilah tertentu yang saya mengalami kesulitan menentukan dalam rumus lmer saya
# 1. tow bersarang di dalam stasiun ketika tow acak dan stasiun diperbaiki
aku bingung, namun tentang membedakan antara istilah bersarang dan interaksi yang menggunakan :
dan acak /
. Dalam contoh saya di atas, saya memiliki (1|station:tow)
di mana saya berharap membaca untuk bersarang di dalam stasiun. Saya telah membaca komentar yang bertentangan di berbagai situs apakah saya harus menggunakan :
atau tidak di /
sini dalam (1|...)
format acak lmer
.
# 2. Interaksi antara stasiun dan hari ketika stasiun diperbaiki dan hari adalah acak
saya kemudian miliki, (1|station:day)
tetapi kali ini saya berharap membaca interaksi antara stasiun dan hari. Sepertinya saya bisa menggunakan stasiun * hari untuk menjelaskan efek individual dari stasiun dan hari serta interaksi mereka (daripada memasukkan masing-masing dari tiga istilah secara terpisah seperti yang saya lakukan di atas), tetapi saya tidak melihat cara menentukan ini ketika satu diperbaiki dan yang lainnya acak. Akan station*(1|day)
melakukan itu?
# 3. Interaksi antara derek dan hari (keduanya acak) ketika derek bersarang di stasiun (tetap)
Lalu yang terakhir, saya memiliki (1|tow:day)
yang saya harap membaca interaksi tow
dan day
, tapi saya bertanya-tanya apakah saya perlu menentukan lagi bahwa derek itu bersarang (tersirat) di stasiun?
Saya baru untuk kedua R
dan lmer
dan pemodelan statistik dan sangat menghargai kesulitan penjelasan menyeluruh dalam setiap tanggapan terhadap pertanyaan saya jika memungkinkan.
Rincian lebih lanjut tentang data saya: Saya bertanya apakah konsentrasi plankton bervariasi di seluruh permukaan fisik di laut dekat pantai. Saya memiliki tiga stasiun, di darat, di dalam, dan di lepas pantai dari front ini. Stasiun dengan demikian diperbaiki. Di setiap stasiun, saya mengambil tiga derek plankton tiruan (dari mana saya mengurutkan, menghitung, dan mendapatkan konsentrasi dalam hal # bug per meter kubik air). Tow acak: di tiga derek saya berharap dapat menjelaskan variabilitas umum dalam plankton di stasiun tertentu. Tow secara intrinsik bersarang di stasiun karena setiap derek tidak memiliki ID unik (123.123.123 adalah ID untuk derek di setiap stasiun). Saya kemudian melakukan ini pada beberapa hari independen dengan front baru yang telah terbentuk. Saya pikir saya bisa menganggap Day sebagai faktor penghambat? Hari acak karena mengulangi ini pada beberapa hari depan yang independen berusaha untuk menangkap variabilitas dari hari ke hari dan mewakili semua hari di mana front ini hadir. Saya ingin tahu tentang istilah interaksi untuk melihat apakah Tows berubah dalam variabilitas dari hari ke hari dan jika stasiun selalu menghasilkan data yang sama atau apakah itu tergantung pada hari?
Sekali lagi, terima kasih atas waktu dan bantuan Anda, saya menghargainya!
R
sintaksis, IMO, itu cukup statistik (wrt memahami bagaimana model yang ditentukan terkait dengan bersarang & interaksi, dll) untuk menjadi on-topik untuk CV.
lmer()
sintaks Anda, Anda telah menentukan model di mana ada efek tetap station
dan empat intersep acak, dibagi oleh individu dengan (1) kombinasi yang sama station
dan tow
, (2) nilai Day
, (3) kombinasi dari station
dan day
dan ( 4) kombinasi dari tow
dan day
, masing-masing. Apakah ini yang Anda maksudkan? Saya tidak yakin karena, seperti ditunjukkan oleh @BabekP, bagaimana Anda menulis formulasi model Anda tidak jelas. Anda telah menulis nama variabel, bukan parameter. Biasanya, dalam model seperti ini, kombinasi variabel ditangkap oleh subskrip.