Ada perbedaan besar antara melakukan estimasi menggunakan hukuman jenis punggungan dan hukuman jenis laso. Penduga tipe punggungan cenderung untuk mengecilkan semua koefisien regresi menuju nol dan bias, tetapi memiliki mudah untuk memperoleh distribusi asimptotik karena mereka tidak mengecilkan variabel apa pun menjadi nol. Bias dalam perkiraan ridge mungkin bermasalah dalam melakukan pengujian hipotesis berikutnya, tetapi saya bukan ahli dalam hal itu. Di sisi lain, denda jenis Lasso / elastic-net menyusut banyak koefisien regresi menjadi nol dan karenanya dapat dilihat sebagai teknik pemilihan model. Masalah melakukan inferensi pada model yang dipilih berdasarkan data biasanya disebut sebagai masalah inferensi selektif atau inferensi pasca seleksi. Bidang ini telah melihat banyak perkembangan dalam beberapa tahun terakhir.
y∼ N( μ , 1 )μμ| y| >c>0cycy
Demikian pula, Lasso (atau jaring elastis) membatasi ruang sampel sedemikian rupa untuk memastikan bahwa model yang dipilih telah dipilih. Pemotongan ini lebih rumit, tetapi dapat dijelaskan secara analitis.
Berdasarkan wawasan ini, seseorang dapat melakukan inferensi berdasarkan distribusi data yang terpotong untuk mendapatkan statistik uji yang valid. Untuk interval kepercayaan dan statistik uji, lihat karya Lee et al .:
http://projecteuclid.org/euclid.aos/1460381681
Metode mereka diimplementasikan dalam R selectiveInference paket .
Estimasi optimal (dan pengujian) setelah pemilihan model dibahas dalam (untuk laso):
https://arxiv.org/abs/1705.09417
dan paket perangkat lunak mereka (jauh kurang komprehensif) tersedia di:
https://github.com/ammeir2/selectiveMLE