Saya melakukan penilaian berbasis komputer dari berbagai metode pemasangan jenis model tertentu yang digunakan dalam ilmu palaeo. Saya memiliki satu set pelatihan ish besar dan jadi saya secara acak (stratified random sampling) menyisihkan satu set tes. Saya memasang berbagai metode pada sampel set pelatihan dan menggunakan model dihasilkan, saya memperkirakan respons untuk sampel set uji dan menghitung RMSEP atas sampel dalam set uji. Ini adalah sekali jalan .
Saya kemudian mengulangi proses ini berkali-kali, setiap kali saya memilih pelatihan yang berbeda dengan secara acak mengambil sampel tes baru.
Setelah melakukan ini saya ingin menyelidiki apakah ada metode yang memiliki kinerja RMSEP lebih baik atau lebih buruk. Saya juga ingin melakukan beberapa perbandingan metode pasangan-bijaksana.
Pendekatan saya adalah menyesuaikan model efek campuran linier (LME), dengan efek acak tunggal untuk Run . Saya menggunakan lmer()
dari lme4 paket sesuai model dan fungsi saya dari multcomp paket untuk melakukan beberapa perbandingan. Model saya pada dasarnya
lmer(RMSEP ~ method + (1 | Run), data = FOO)
di mana method
ada faktor yang menunjukkan metode mana yang digunakan untuk menghasilkan prediksi model untuk set tes dan Run
merupakan indikator untuk setiap Jalankan tertentu dari "percobaan" saya.
Pertanyaan saya berkaitan dengan residu LME. Mengingat efek acak tunggal untuk Run, saya mengasumsikan bahwa nilai RMSEP untuk menjalankan itu berkorelasi pada tingkat tertentu tetapi tidak berkorelasi antara proses, berdasarkan korelasi yang diinduksi efek acak yang diberikan.
Apakah asumsi independensi antar proses ini valid? Jika tidak, apakah ada cara untuk menjelaskan ini dalam model LME atau haruskah saya mencari untuk menggunakan jenis analisis statis lain untuk menjawab pertanyaan saya?