Saya pikir Anda harus menggunakan rentang 0 hingga
λ′maks=11 - αλmaks
Alasan saya berasal dari memperpanjang kasus laso, dan derivasi penuh di bawah ini. adalah ia tidak menangkap batasan disumbangkan oleh regularisasi . Jika saya mencari cara untuk memperbaikinya (dan memutuskan apakah itu benar-benar perlu diperbaiki), saya akan kembali dan mengeditnya.dofℓ2
Definisikan tujuan
f( b ) =12∥ y- Xb∥2+12γ∥ b∥2+ δ∥ b∥1
Ini adalah tujuan yang Anda gambarkan, tetapi dengan beberapa parameter diganti untuk meningkatkan kejelasan.
Secara konvensional, hanya bisa menjadi solusi untuk masalah optimisasi jika gradien pada adalah nol. Namun istilah tidak mulus, jadi syaratnya adalah terletak pada subgradien pada .b = 0min f( b )b = 0∥ b∥10b = 0
Subgradien dari adalahf
∂f= -XT( y- Xb ) + γb + δ∂∥ b∥1
di mana menunjukkan subgradient sehubungan dengan . Pada , ini menjadi∂bb = 0
∂f|b = 0= -XTy+ δ[ - 1 , 1]d
mana adalah dimensi , dan adalahdb[ - 1 , 1]dd kubus dimensi. Jadi untuk masalah pengoptimalan untuk memiliki solusi , harus seperti itub = 0
(XTy)saya∈ δ[ - 1 , 1 ]
untuk setiap komponensaya . Ini setara dengan
δ>makssaya∣∣∣∣∑jyjXsaya j∣∣∣∣
yang merupakan definisi yang Anda berikan untuk . Jika sekarang ditukar, rumus dari atas pos keluar.λmaksδ= ( 1 - α ) λ