Saat ini saya sedang mengerjakan pembuatan model prediksi untuk hasil biner pada dataset dengan ~ 300 variabel dan 800 pengamatan. Saya telah membaca banyak di situs ini tentang masalah yang terkait dengan regresi bertahap dan mengapa tidak menggunakannya.
Saya telah membaca regresi LASSO dan kemampuannya untuk pemilihan fitur dan telah berhasil mengimplementasikannya dengan menggunakan paket "caret" dan "glmnet".
Saya dapat mengekstraksi koefisien model dengan optimal lambda
dan alpha
dari "caret"; Namun, saya tidak terbiasa dengan cara menafsirkan koefisien.
- Apakah koefisien LASSO ditafsirkan dalam metode yang sama dengan regresi logistik?
- Apakah pantas menggunakan fitur yang dipilih dari LASSO dalam regresi logistik?
EDIT
Interpretasi dari koefisien, seperti pada koefisien eksponensial dari regresi LASSO sebagai log odds untuk 1 unit perubahan koefisien sambil menahan semua koefisien lainnya konstan.