Saat ini saya menjalankan beberapa model linear efek campuran.
Saya menggunakan paket "lme4" di R.
Model saya mengambil bentuk:
model <- lmer(response ~ predictor1 + predictor2 + (1 | random effect))
Sebelum menjalankan model saya, saya memeriksa kemungkinan multikolinieritas antara prediktor.
Saya melakukan ini dengan:
Buat kerangka data prediksi
dummy_df <- data.frame(predictor1, predictor2)
Gunakan fungsi "cor" untuk menghitung korelasi Pearson antara prediktor.
correl_dummy_df <- round(cor(dummy_df, use = "pair"), 2)
Jika "korelasi_dummy_df" lebih besar dari 0,80, maka saya memutuskan bahwa prediktor1 dan prediktor2 terlalu berkorelasi tinggi dan tidak dimasukkan dalam model saya.
Dalam melakukan beberapa bacaan, akan muncul cara yang lebih objektif untuk memeriksa multikolinieritas.
Adakah yang punya saran tentang ini?
"Variance Inflation Factor (VIF)" tampaknya seperti satu metode yang valid.
VIF dapat dihitung menggunakan fungsi "corvif" dalam paket AED (non-cran). Paket ini dapat ditemukan di http://www.highstat.com/book2.htm . Paket mendukung buku berikut:
Zuur, AF, Ieno, EN, Walker, N., Saveliev, AA & Smith, GM 2009. Model efek campuran dan ekstensi dalam ekologi dengan R, edisi pertama. Springer, New York.
Sepertinya aturan umum adalah bahwa jika VIF> 5, maka multikolinieritas tinggi antara prediktor.
Apakah menggunakan VIF lebih kuat daripada korelasi Pearson sederhana?
Memperbarui
Saya menemukan blog yang menarik di:
http://hlplab.wordpress.com/2011/02/24/diagnosing-collinearity-in-lme4/
Blogger menyediakan beberapa kode yang berguna untuk menghitung VIF untuk model dari paket lme4.
Saya telah menguji kodenya dan hasilnya bagus. Dalam analisis saya selanjutnya, saya telah menemukan bahwa multikolinieritas bukan masalah bagi model saya (semua nilai VIF <3). Ini menarik, mengingat bahwa saya sebelumnya telah menemukan korelasi Pearson yang tinggi antara beberapa prediktor.
http://highstat.com/Books/BGS/GAMM/RCodeP2/HighstatLibV6.R
AED
Paket telah dihentikan ; sebagai gantinya, hanyasource("http://www.highstat.com/Book2/HighstatLibV6.R")
untukcorvif
fungsi. (2) Harapan untuk memberikan jawaban yang nyata, tetapi (a) Saya percaya VIF memperhitungkan multikolinieritas (misalnya Anda mungkin memiliki tiga prediktor, tidak ada yang memiliki korelasi berpasangan yang kuat, tetapi kombinasi linear A dan B berkorelasi kuat dengan C ) dan (b) Saya memiliki keraguan kuat tentang kebijaksanaan menjatuhkan istilah-istilah collinear; lihat Graham Ecology 2003, doi: 10.1890 / 02-3114