Di kelas pembelajaran mesin saya, kami telah belajar tentang bagaimana regresi LASSO sangat baik dalam melakukan pemilihan fitur, karena menggunakan regularisasi .
Pertanyaan saya: apakah orang biasanya menggunakan model LASSO hanya untuk melakukan pemilihan fitur (dan kemudian melanjutkan untuk membuang fitur-fitur tersebut ke model pembelajaran mesin yang berbeda), atau apakah mereka biasanya menggunakan LASSO untuk melakukan pemilihan fitur dan regresi yang sebenarnya?
Sebagai contoh, anggaplah Anda ingin melakukan regresi ridge, tetapi Anda percaya bahwa banyak fitur Anda tidak terlalu baik. Apakah bijaksana untuk menjalankan LASSO, hanya mengambil fitur yang tidak mendekati nol oleh algoritma, dan kemudian hanya menggunakan yang ada di dumping data Anda ke dalam model regresi ridge? Dengan cara ini, Anda mendapatkan manfaat dari regularisasi untuk melakukan pemilihan fitur, tetapi juga manfaat dari regularisasi untuk mengurangi overfitting. (Saya tahu bahwa ini pada dasarnya sama dengan Regresi Jaring Elastis, tetapi sepertinya Anda tidak perlu memiliki istilah dan dalam fungsi tujuan regresi akhir.)
Selain dari regresi, apakah ini strategi yang bijaksana ketika melakukan tugas klasifikasi (menggunakan SVM, jaringan saraf, hutan acak, dll.)?