Ini dapat diserang dengan sejumlah cara, termasuk pendekatan yang cukup ekonomis melalui kondisi Karush – Kuhn – Tucker .
Di bawah ini adalah argumen alternatif yang cukup mendasar.
Solusi kuadrat terkecil untuk desain ortogonal
Misalkan terdiri dari kolom ortogonal. Kemudian, solusi kuadrat-terkecil adalah
X
β^LS=(XTX)−1XTy=XTy.
Beberapa masalah setara
Melalui formulir Lagrangian, mudah untuk melihat bahwa masalah yang setara dengan yang dipertimbangkan dalam pertanyaan adalah
minβ12∥y−Xβ∥22+γ∥β∥1.
Memperluas istilah pertama yang kita dapatkan dan karena tidak mengandung dari variabel yang diminati, kita dapat membuangnya dan mempertimbangkan masalah lain yang setara,
12yTy−yTXβ+12βTβyTy
minβ(−yTXβ+12∥β∥2)+γ∥β∥1.
Memperhatikan bahwa , masalah sebelumnya dapat ditulis ulang sebagai
β^LS=XTy
minβ∑i=1p−β^LSiβi+12β2i+γ|βi|.
Fungsi obyektif kami sekarang adalah jumlah tujuan, masing-masing terkait dengan variabel terpisah , sehingga masing-masing dapat diselesaikan secara individual.βi
Seluruhnya sama dengan jumlah bagian-bagiannya
Perbaiki tertentu . Kemudian, kami ingin meminimalkan
i
Li=−β^LSiβi+12β2i+γ|βi|.
Jika , maka kita harus memiliki karena jika tidak kita bisa membalikkan tandanya dan mendapatkan nilai yang lebih rendah untuk fungsi tujuan. Demikian juga jika , maka kita harus memilih .β^LSi>0βi≥0β^LSi<0βi≤0
Kasus 1 : . Karena ,
dan membedakannya dengan dan menetapkan sama dengan nol , kami mendapatkan dan ini hanya layak jika sisi kanannya tidak negatif, jadi dalam hal ini solusi sebenarnya adalah
β^LSi>0βi≥0
Li=−β^LSiβi+12β2i+γβi,
βiβi=β^LSi−γβ^lassoi=(β^LSi−γ)+=sgn(β^LSi)(|β^LSi|−γ)+.
Kasus 2 : . Ini menyiratkan kita harus memiliki dan karenanya
Membedakan sehubungan dengan dan pengaturan sama dengan nol, kita mendapatkan . Tetapi, sekali lagi, untuk memastikan ini layak, kita memerlukan , yang dicapai dengan mengambil
β^LSi≤0βi≤0
Li=−β^LSiβi+12β2i−γβi.
βiβi=β^LSi+γ=sgn(β^LSi)(|β^LSi|−γ)βi≤0β^lassoi=sgn(β^LSi)(|β^LSi|−γ)+.
Dalam kedua kasus, kami mendapatkan formulir yang diinginkan, dan kami selesai.
Komentar akhir
Perhatikan bahwa seiring meningkatnya , maka masing-masingtentu berkurang, maka demikian juga . Ketika , kami memulihkan solusi OLS, dan, untuk, kami memperoleh untuk semua .γ|β^lassoi|∥β^lasso∥1γ=0γ>maxi|β^LSi|β^lassoi=0i