Ada berbagai masalah dengan pemilihan bertahap. Saya membahas secara bertahap dalam jawaban saya di sini: Algoritma untuk pemilihan model otomatis . Dalam jawaban itu, saya terutama tidak fokus pada masalah dengan inferensi, tetapi pada kenyataan bahwa koefisien bias (atlet yang mencoba analog dengan variabel). Karena koefisien bias jauh dari nilai sebenarnya, kesalahan prediksi sampel harus diperbesar, ceteris paribus.
Pertimbangkan gagasan trade-off bias-varians . Jika Anda menganggap keakuratan model Anda sebagai varian dari kesalahan prediksi (mis., MSE:1/n∑(yi−y^i)2), kesalahan prediksi yang diharapkan adalah jumlah dari tiga sumber ragam yang berbeda:
Ketiga istilah ini adalah varian dari estimasi fungsi Anda, kuadrat bias estimasi , dan kesalahan yang tidak dapat direduksi dalam proses pembuatan data, masing-masing. (Yang terakhir ada karena data tidak deterministik-Anda tidak akan pernah mendapatkan prediksi yang lebih dekat daripada rata-rata.) Yang dua berasal dari prosedur yang digunakan untuk memperkirakan model Anda. Secara default, kami mungkin berpikir OLS adalah prosedur yang digunakan untuk memperkirakan model, tetapi lebih tepat untuk mengatakan bahwa pemilihan bertahap atas perkiraan OLS
E[(yi−y^i)2]=Var(f^)+[Bias(f^)]2+Var(ε)
adalah prosedurnya. Gagasan trade-off bias-varians adalah bahwa sementara model penjelas dengan tepat menekankan ketidakberpihakan, model prediktif dapat mengambil manfaat dari menggunakan prosedur bias jika varians cukup dikurangi (untuk penjelasan lebih lengkap, lihat:
Masalah apa yang dilakukan metode penyusutan menyelesaikan ? ).
Dengan ide-ide itu dalam pikiran, inti dari jawaban saya yang terkait di atas adalah bahwa banyak bias diinduksi. Semua hal dianggap sama, yang akan membuat prediksi sampel menjadi lebih buruk. Sayangnya, pemilihan bertahap tidak mengurangi varian estimasi. Paling-paling, variansnya sama, tetapi kemungkinan besar akan membuat variansnya lebih buruk juga (misalnya, @Glen_b melaporkan hanya 15,5% dari waktu yang merupakan variabel yang tepat bahkan dipilih dalam studi simulasi yang dibahas di sini: Mengapa nilai-p menyesatkan setelah melakukan seleksi bertahap? ).