Untuk menghitung prediksi rata-rata model pada skala respons GLM, yang "benar" dan mengapa?
- Hitung model rata-rata prediksi pada skala tautan dan kemudian kembali transformasi ke skala respons, atau
- Kembali mengubah prediksi ke skala respons dan kemudian menghitung rata-rata model
Prediksinya dekat tetapi tidak sama jika modelnya adalah GLM. Paket R yang berbeda memberikan opsi untuk keduanya (dengan standar yang berbeda). Beberapa kolega berpendapat dengan keras bahwa # 1 salah karena "semua orang melakukan # 2". Intuisi saya mengatakan bahwa # 1 adalah "benar" karena membuat semua linear matematika linear (# 2 rata-rata hal-hal yang tidak pada skala linier). Simulasi sederhana menemukan bahwa # 2 memiliki MSE yang sangat (sangat!) Sedikit lebih kecil dari # 1. Jika # 2 benar, apa alasannya? Dan, jika # 2 benar, mengapa alasan saya (menjaga linear matematika linear) alasan yang buruk?
Sunting 1: Komputasi berarti marginal atas tingkat faktor lain dalam GLM adalah masalah yang mirip dengan pertanyaan yang saya ajukan di atas. Russell Lenth menghitung alat marginal model GLM menggunakan "waktu" (kata-katanya) # 1 (dalam paket emmeans) dan argumennya mirip dengan intuisi saya.
Sunting 2: Saya menggunakan rata-rata model untuk merujuk ke alternatif untuk pemilihan model di mana prediksi (atau koefisien) diperkirakan sebagai rata-rata tertimbang untuk semua atau sebagian dari model bersarang "terbaik" (lihat referensi dan paket R di bawah) .
Mengingat model bersarang, di mana adalah prediksi linear (dalam ruang link) untuk individu untuk model , dan adalah berat untuk model , model-rata prediksi menggunakan # 1 di atas (rata-rata pada link skala dan kemudian backtransformasi ke skala respons) adalah:η m i i m w m m
dan prediksi model-rata-rata menggunakan # 2 di atas (kembali mengubah semua prediksi dan kemudian rata-rata pada skala respons) adalah:
Beberapa metode Bayesian dan Frequentist dari model rata-rata adalah:
Hoeting, JA, Madigan, D., Raftery, AE dan Volinsky, CT, 1999. Model Bayesian rata-rata: tutorial. Ilmu statistik, hal.382-401.
Burnham, KP dan Anderson, DR, 2003. Pemilihan model dan inferensi multimodel: pendekatan informasi-teori praktis. Sains Springer & Media Bisnis.
Hansen, BE, 2007. Model kuadrat terkecil rata-rata. Econometrica, 75 (4), hal.1175-1189.
Claeskens, G. dan Hjort, NL, 2008. Pemilihan model dan rata-rata model. Cambridge Books.
Paket R termasuk BMA , MuMIn , BAS , dan AICcmodavg . (Catatan: ini bukan pertanyaan tentang kebijaksanaan rata-rata model).