Secara intuitif, laso grup dapat lebih disukai daripada laso karena menyediakan sarana bagi kami untuk memasukkan (jenis tertentu) informasi tambahan ke dalam perkiraan kami untuk koefisien sebenarnya . Sebagai skenario ekstrem, pertimbangkan hal berikut:β∗
Dengan , tuliskan sebagai dukungan dari . Pertimbangkan penaksir "oracle" yang merupakan grup laso dengan dua grup - satu dukungan dan satu pelengkap. Biarkan menjadi nilai terkecil dari yang membuat . Karena sifat penalti lasso grup, kita tahu bahwa pada bergerak dari ke (untuk beberapa orang kecily∼N(Xβ∗,σ2I)S={j:β∗j≠0}β∗
β^=argminβ∥y−Xβ∥22+λ(|S|1/2∥βS∥2+(p−|S|)1/2∥βSC∥2),
λmaxλβ^=0λλmaxλmax−ϵϵ>0 ), tepat satu kelompok akan masuk ke dalam dukungan dari , yang populer dianggap sebagai perkiraan untuk . Karena pengelompokan kami, dengan probabilitas tinggi, grup yang dipilih adalah , dan kami akan melakukan pekerjaan dengan sempurna.
β^SS
Dalam praktiknya, kami tidak memilih grup ini dengan baik. Namun, kelompok-kelompok itu, walaupun lebih baik daripada skenario ekstrem di atas, masih akan membantu kita: pilihan masih akan dibuat antara sekelompok kovariat sejati dan sekelompok kovariat tidak benar. Kami masih meminjam kekuatan.
Ini diformalkan di sini . Mereka menunjukkan, dalam beberapa kondisi, bahwa batas atas pada kesalahan prediksi laso grup lebih rendah daripada batas bawah pada kesalahan prediksi laso polos. Artinya, mereka membuktikan bahwa pengelompokan membuat estimasi kami lebih baik.
Untuk pertanyaan kedua Anda: Hukuman laso (polos) linier piecewise, dan ini memunculkan jalur solusi linear piecewise. Secara intuitif, dalam kasus laso grup, penalti tidak lagi linier, jadi kami tidak lagi memiliki properti ini. Referensi hebat tentang linearitas jalur solusi ada di sini . Lihat proposisi mereka 1. Biarkan dan . Mereka menunjukkan bahwa jalur solusi dari grup laso adalah linier jika dan hanya jika sama-sama konstan. Tentu saja, itu bukan karena penalti kami memiliki kelengkungan global.L(β)=∥y−Xβ∥22J(β)=∑g∈G|g|1/2∥βg∥2
(∇2L(β^)+λ∇2J(β^))−1∇J(β^)
J