Metodologi ini dijelaskan dalam makalah Jalur Regularisasi kertas glmnet untuk Model Linear Umum melalui Keturunan Koordinat . Meskipun metodologi di sini adalah untuk kasus umum baik regularisasi dan , metodologi ini harus berlaku untuk LASSO (hanya ) juga.L 2 L 1L1L2L1
Solusi untuk maksimum diberikan di bagian 2.5. λ
Ketika , kita melihat dari (5) bahwa akan tetap nol jika . Karenanya, ˜ β j1β~=0β~jNαλmax=maksl| ⟨Xl,y⟩|1N|⟨xj,y⟩|<λαNαλmax=maxl|⟨xl,y⟩|
Yaitu, kami amati bahwa aturan pembaruan untuk beta memaksa semua perkiraan parameter menjadi nol untuk seperti yang ditentukan di atas.λ>λmax
Penentuan dan jumlah titik kisi tampaknya kurang berprinsip. Di glmnet mereka menetapkan , dan kemudian memilih kisi titik yang berjarak sama pada skala logaritmik. λ m i n = 0.001 ∗ λ m a x 100λminλmin=0.001∗λmax100
Ini bekerja dengan baik dalam praktiknya, dalam penggunaan glmnet yang ekstensif, saya tidak pernah menemukan grid ini terlalu kasar.
Dalam LASSO ( ) hanya hal-hal yang berfungsi lebih baik, karena metode LARS memberikan perhitungan yang tepat ketika berbagai prediktor masuk ke dalam model. LARS yang sebenarnya tidak melakukan pencarian kisi-kisi atas , melainkan menghasilkan ekspresi yang tepat untuk jalur solusi untuk koefisien.
Berikut ini adalah tampilan terperinci pada perhitungan yang tepat dari jalur koefisien dalam dua kasus prediktor. λL1λ
Kasus untuk model non-linear (yaitu logistik, poisson) lebih sulit. Pada tingkat tinggi, pertama perkiraan kuadratik untuk fungsi kerugian diperoleh pada parameter awal , dan kemudian perhitungan di atas digunakan untuk menentukan . Penghitungan jalur parameter yang tepat tidak dimungkinkan dalam kasus ini, bahkan ketika hanya pengaturan yang disediakan, sehingga pencarian kisi adalah satu-satunya pilihan.λ m a x L 1β=0λmaxL1
Bobot sampel juga memperumit situasi, produk dalam harus diganti di tempat yang sesuai dengan produk dalam yang tertimbang.