Maaf jika pertanyaan ini sedikit mendasar.
Saya mencari untuk menggunakan pemilihan variabel LASSO untuk model regresi linier berganda di R. Saya memiliki 15 prediktor, salah satunya adalah kategorikal (akankah itu menyebabkan masalah?). Setelah mengatur dan saya menggunakan perintah berikut:y
model = lars(x, y)
coef(model)
Masalah saya adalah ketika saya menggunakan coef(model)
. Ini mengembalikan matriks dengan 15 baris, dengan satu prediktor tambahan ditambahkan setiap kali. Namun tidak ada saran untuk model mana yang harus dipilih. Apakah saya melewatkan sesuatu? Apakah ada cara saya bisa mendapatkan paket lars hanya untuk mengembalikan satu model " terbaik "?
Ada posting lain yang menyarankan untuk menggunakan glmnet
tetapi ini tampaknya lebih rumit. Upaya adalah sebagai berikut, menggunakan dan . Apakah saya melewatkan sesuatu di sini ?: y
cv = cv.glmnet(x, y)
model = glmnet(x, y, type.gaussian="covariance", lambda=cv$lambda.min)
predict(model, type="coefficients")
Perintah terakhir mengembalikan daftar variabel saya, mayoritas dengan koefisien meskipun ada yang = 0. Apakah ini pilihan model " terbaik " yang benar yang dipilih oleh LASSO? Jika saya kemudian cocok dengan model linier dengan semua variabel saya yang memiliki koefisien, not=0
saya mendapatkan estimasi koefisien yang sangat mirip, tetapi sedikit berbeda. Apakah ada alasan untuk perbedaan ini? Apakah dapat diterima untuk mereparasi model linier dengan variabel-variabel ini dipilih oleh LASSO dan menganggapnya sebagai model terakhir saya? Kalau tidak, saya tidak bisa melihat nilai p apa pun untuk signifikansi. Apakah saya melewatkan sesuatu?
Apakah
type.gaussian="covariance"
memastikan bahwa yang glmnet
menggunakan regresi linier berganda?
Apakah normalisasi otomatis variabel mempengaruhi koefisien sama sekali? Apakah ada cara untuk memasukkan istilah interaksi dalam prosedur LASSO?
Saya ingin menggunakan prosedur ini lebih sebagai demonstrasi bagaimana LASSO dapat digunakan daripada untuk model apa pun yang benar-benar akan digunakan untuk inferensi / prediksi penting jika itu mengubah apa pun.
Terima kasih telah meluangkan waktu untuk membaca ini. Setiap komentar umum tentang LASSO / lars / glmnet juga akan sangat dihargai.