Setelah membaca Galit Shmueli "To Explain or to Predict" (2010) saya bingung dengan kontradiksi yang nyata. Ada tiga tempat,
- Pilihan model berbasis AIC- dibandingkan BIC (akhir hal. 300 - awal hal. 301): sederhananya, AIC harus digunakan untuk memilih model yang dimaksudkan untuk prediksi sedangkan BIC harus digunakan untuk memilih model untuk penjelasan . Selain itu (tidak dalam makalah di atas), kita tahu bahwa dalam beberapa kondisi BIC memilih model sebenarnya di antara set model kandidat; model yang sebenarnya adalah apa yang kita cari dalam pemodelan penjelasan (akhir dari hal. 293).
- Aritmatika sederhana: AIC akan memilih model yang lebih besar daripada BIC untuk sampel berukuran 8 atau lebih besar (memuaskan karena penalti kompleksitas yang berbeda dalam AIC versus BIC).
- Model "benar" (yaitu model dengan regresi yang benar dan bentuk fungsional yang tepat tetapi koefisien estimasi tidak sempurna) mungkin bukan model terbaik untuk prediksi (hal. 307): model regresi dengan prediktor yang hilang mungkin merupakan model peramalan yang lebih baik - pengenalan bias karena prediktor yang hilang dapat dikalahkan oleh pengurangan varian karena estimasi yang tidak tepat.
Poin 1. dan 2. menunjukkan bahwa model yang lebih besar mungkin lebih baik untuk prediksi daripada model yang lebih pelit. Sementara itu, poin 3. memberikan contoh yang berlawanan di mana model yang lebih pelit lebih baik untuk prediksi daripada model yang lebih besar. Saya menemukan ini membingungkan.
Pertanyaan:
- Bagaimana kontradiksi yang tampak antara poin {1. dan 2.} dan 3. dijelaskan / diselesaikan?
- Dalam terang poin 3., dapatkah Anda memberikan penjelasan intuitif mengapa dan bagaimana model yang lebih besar yang dipilih oleh AIC sebenarnya lebih baik untuk prediksi daripada model yang lebih pelit yang dipilih oleh BIC?