Pertimbangkan percobaan dengan beberapa partisipan manusia, masing-masing diukur beberapa kali dalam dua kondisi. Model efek campuran dapat dirumuskan (menggunakan sintaks lme4 ) sebagai:
fit = lmer(
formula = measure ~ (1|participant) + condition
)
Sekarang, katakan saya ingin membuat interval kepercayaan bootstrap untuk prediksi model ini. Saya pikir saya telah datang dengan metode yang sederhana dan efisien secara komputasi, dan saya yakin saya bukan yang pertama memikirkannya, tetapi saya mengalami kesulitan menemukan publikasi sebelumnya yang menjelaskan pendekatan ini. Ini dia:
- Sesuai model (seperti di atas), sebut ini "model asli"
- Dapatkan prediksi dari model asli, sebut ini "prediksi asli"
- Dapatkan residu dari model asli yang terkait dengan setiap respons dari masing-masing peserta
- Sampel ulang residu, sampel peserta dengan penggantian
- Paskan model efek campuran linier dengan kesalahan gaussian ke residu , sebut ini "model sementara"
- Hitung prediksi dari model sementara untuk setiap kondisi (prediksi ini akan mendekati nol), sebut ini "prediksi sementara"
- Tambahkan prediksi sementara ke prediksi asli, sebut hasilnya "prediksi sampel"
- Ulangi langkah 4 hingga 7 berkali-kali, menghasilkan distribusi prediksi resample untuk setiap kondisi dari mana sekali dapat menghitung CI.
Saya telah melihat prosedur "residual bootstrap" dalam konteks regresi sederhana (yaitu bukan model campuran) di mana residu dijadikan sampel sebagai unit resampling dan kemudian ditambahkan ke prediksi model asli sebelum memasang model baru pada setiap iterasi dari bootstrap, tetapi ini agak berbeda dari pendekatan yang saya jelaskan di mana residu tidak pernah di-resampled, orang-orang, dan hanya setelahmodel sementara diperoleh apakah prediksi model asli ikut bermain. Fitur terakhir ini memiliki manfaat sampingan yang benar-benar bagus karena tidak peduli kompleksitas model aslinya, model sementara dapat selalu cocok sebagai model campuran linier gaussian, yang dapat jauh lebih cepat dalam beberapa kasus. Sebagai contoh, saya baru-baru ini memiliki data binomial dan 3 variabel prediktor, salah satunya saya duga akan menyebabkan efek sangat non-linear, jadi saya harus menggunakan Generalized Additive Mixed Modeling menggunakan fungsi tautan binomial. Pemasangan model asli dalam kasus ini membutuhkan waktu lebih dari satu jam, sedangkan pemasangan LMM gaussian pada setiap iterasi hanya membutuhkan beberapa detik.
Saya benar-benar tidak ingin mengklaim prioritas pada hal ini jika prosedurnya sudah diketahui, jadi saya akan sangat berterima kasih jika ada yang bisa memberikan informasi di mana ini mungkin telah dijelaskan sebelumnya. (Juga, jika ada masalah mencolok dengan pendekatan ini, beri tahu saya!)