Saya mundur prediktor kontinu pada lebih dari 60 variabel (baik kontinu dan kategoris) menggunakan LASSO (glmnet).
Dalam memeriksa plot jejak variabel, saya perhatikan bahwa seiring bertambahnya log lambda, salah satu variabel kunci memiliki koefisien yang benar-benar meningkat. Kemudian, setelah titik tertentu, mulai berkurang seperti yang kita harapkan.
Untuk memastikan ini bukan kebetulan, saya menjalankan 10 model menggunakan bootstraps dan memperoleh hasil yang sangat mirip.
Apakah ini mungkin, atau ada masalah dengan data? Jika sah, apa tren ini dalam koefisien variabel memberitahu kita tentang variabel dan hubungannya dengan respon?