Saya menggunakan Lasso untuk pemilihan fitur dalam pengaturan dimensi yang relatif rendah (n >> p). Setelah memasang model Lasso, saya ingin menggunakan kovariat dengan koefisien bukan nol agar sesuai dengan model tanpa penalti. Saya melakukan ini karena saya ingin perkiraan yang tidak bias yang tidak dapat diberikan oleh Lasso kepada saya. Saya juga ingin nilai-p dan interval kepercayaan untuk estimasi yang tidak bias.
Saya kesulitan menemukan literatur tentang topik ini. Sebagian besar literatur yang saya temukan adalah tentang menempatkan interval kepercayaan pada perkiraan Lasso, bukan model yang dipasang kembali.
Dari apa yang saya baca, cukup dengan mereparasi model menggunakan seluruh dataset mengarah ke kesalahan p-nilai / std kecil yang tidak realistis. Saat ini, pemisahan sampel (dengan gaya Wasserman dan Roeder (2014) atau Meinshausen et al. (2009)) tampaknya merupakan tindakan yang baik, tetapi saya mencari lebih banyak saran.
Adakah yang mengalami masalah ini? Jika demikian, bisakah Anda memberikan beberapa saran.