Saya telah bertanya-tanya, mengapa metode pemilihan model LASSO dan LARS begitu populer walaupun pada dasarnya mereka hanyalah variasi dari seleksi langkah-ke depan (dan karenanya menderita ketergantungan jalur)?
Demikian pula, mengapa metode General to Specific (GETS) untuk pemilihan model sebagian besar diabaikan, meskipun mereka melakukan lebih baik daripada LARS / LASSO karena mereka tidak menderita masalah regresi bertahap? (referensi dasar untuk GETS: http://www.federalreserve.gov/pubs/ifdp/2005/838/ifdp838.pdf - algoritma baru dalam ini dimulai dengan model luas dan pencarian pohon yang menghindari ketergantungan jalur, dan telah ditunjukkan kepada sering lebih baik daripada LASSO / LARS).
Rasanya aneh, LARS / LASSO tampaknya mendapatkan paparan dan kutipan jauh lebih banyak daripada General to Specific (GETS), ada yang punya pikiran?
Tidak mencoba memulai perdebatan sengit, lebih mencari penjelasan rasional mengapa literatur tampaknya berfokus pada LASSO / LARS daripada GETS dan hanya sedikit orang yang benar-benar menunjukkan kekurangan LASSO / LARS.