Dalam penginderaan terkompresi, ada jaminan teorema bahwa memiliki solusi jarang yang unik c (Lihat lampiran untuk detail lebih lanjut).
Apakah ada teorema yang serupa untuk laso? Jika ada teorema seperti itu, tidak hanya akan menjamin stabilitas laso, tetapi juga akan memberikan laso dengan interpretasi yang lebih bermakna:
laso dapat mengungkap vektor koefisien regresi jarang yang digunakan untuk menghasilkan respon oleh .
Ada dua alasan mengapa saya mengajukan pertanyaan ini:
Saya pikir 'laso nikmat solusi jarang' bukan jawaban mengapa menggunakan laso untuk pemilihan fitur karena kita bahkan tidak tahu apa kelebihan fitur yang kita pilih.
Saya belajar laso terkenal karena tidak stabil untuk pemilihan fitur. Dalam praktiknya, kita harus menjalankan sampel bootstrap untuk mengevaluasi stabilitasnya. Apa alasan paling penting yang menyebabkan ketidakstabilan ini?
Lampiran:
Diberikan . adalah vektor sparse ( ). Proses menghasilkan respons . Jika memiliki NSP (null space property) of order dan matriks kovarians tidak memiliki nilai eigen mendekati nol, akan ada solusi unik untuk
Teorema ini juga mengatakan juga jika tidak memiliki NSP of order , tidak ada harapan untuk menyelesaikan .
EDIT:
Setelah menerima jawaban yang luar biasa ini, saya menyadari bahwa saya bingung ketika mengajukan pertanyaan ini.
Mengapa pertanyaan ini membingungkan:
Saya membaca makalah penelitian di mana kita harus memutuskan berapa banyak fitur (kolom) yang akan dimiliki matriks desain (fitur tambahan dibuat dari fitur utama). Karena ini adalah masalah khas , diharapkan dibangun dengan baik sehingga solusi untuk laso dapat menjadi pendekatan yang baik dari solusi jarang nyata.
Alasannya dibuat dari teorema yang saya sebutkan dalam lampiran: Jika kita bertujuan untuk menemukan solusi ombak , lebih baik memiliki NSP of order .
Untuk matriks , jika dilanggar, maka
tidak ada yang stabil dan pemulihan yang kuat dari dari dan adalah mungkin
berkorespondensi dengan , berkorespondensi dengan
... seperti yang diharapkan dari hubungan , pemilihan deskriptor menjadi lebih tidak stabil, yaitu, untuk set pelatihan yang berbeda, deskriptor yang dipilih sering berbeda ...
Kutipan kedua adalah bagian yang membingungkan saya. Tampak bagi saya ketika ketimpangan dilanggar itu bukan hanya solusi mungkin non-unik (tidak disebutkan), tetapi deskriptor juga akan menjadi lebih tidak stabil.