Apakah itu tidak menyebabkan pemasangan yang berlebihan? Apakah hasil saya akan lebih andal jika saya menambahkan prosedur jack-knife atau bootstrap sebagai bagian dari analisis?
Apakah itu tidak menyebabkan pemasangan yang berlebihan? Apakah hasil saya akan lebih andal jika saya menambahkan prosedur jack-knife atau bootstrap sebagai bagian dari analisis?
Jawaban:
Saya pikir membangun model dan mengujinya adalah hal yang berbeda. Penghapusan mundur adalah bagian dari model bangunan. Pisau jack dan bootstrap lebih sering digunakan untuk mengujinya.
Anda tentu bisa memiliki perkiraan yang lebih andal dengan bootstrap dan pisau jack daripada eleiminasi mundur sederhana. Tetapi jika Anda benar-benar ingin menguji overfitting, tes pamungkas adalah sampel terpisah, latih pada beberapa, uji pada yang lain. Leave-one-out terlalu tidak stabil / tidak dapat diandalkan untuk tujuan ini: http://www.russpoldrack.org/2012/12/the-perils-of-leave-one-out.html
Saya pikir setidaknya 10% dari subjek harus keluar untuk mendapatkan estimasi yang lebih stabil dari model. Dan jika Anda memiliki 20 mata pelajaran, 2 mata pelajaran masih sangat sedikit. Tetapi kemudian pertanyaannya menjadi apakah Anda memiliki sampel yang cukup besar untuk membangun model yang dapat diterapkan pada seluruh populasi.
Semoga ini menjawab pertanyaan Anda setidaknya sebagian.