Dimulai dengan rumusan masalah regresi ridge sebagai
min∥Xβ−y∥22+λ∥x∥22
Anda dapat menulis masalahnya sebagai
min∥Aβ−b∥22
dimana
A=[Xλ−−√I]
dan
b=[y0].
Matriks memiliki rank kolom penuh karena bagian. Dengan demikian masalah kuadrat terkecil sebagai solusi yang unikAλ−−√I
β^=(ATA)−1ATb
Menulis ini dalam bentuk dan , dan menyederhanakan banyak 0, kita dapatkanXy
β^=(XTX+λI)−1XTy
Tidak ada dalam derivasi ini bergantung pada apakah memiliki lebih banyak baris atau kolom, atau bahkan pada apakah memiliki peringkat penuh. Formula ini berlaku untuk kasus yang tidak ditentukan. XX
Ini adalah fakta aljabar bahwa untuk ,λ>0
(XTX+λI)−1XT=XT(XXT+λI)−1
Jadi kami juga memiliki opsi untuk menggunakan
β^=XT(XXT+λI)−1y .
Untuk menjawab pertanyaan spesifik Anda:
Ya, kedua rumus berfungsi untuk kasus yang tidak ditentukan serta kasus yang ditentukan lebih lanjut. Mereka juga bekerja jika kurang dari minimum jumlah baris dan kolom dari . Versi kedua dapat lebih efisien untuk masalah yang tidak ditentukan karena lebih kecil dari dalam kasus itu. rank(X)XXXTXTX
Saya tidak mengetahui adanya penurunan versi alternatif dari rumus yang dimulai dengan beberapa masalah kuadrat terkecil teredam lainnya dan menggunakan persamaan normal. Dalam kasus apa pun Anda dapat menurunkannya secara langsung menggunakan sedikit aljabar.
Mungkin saja Anda memikirkan masalah regresi ridge dalam formulir
min∥β∥22
tunduk pada
∥Xβ−y∥22≤ϵ.
Namun, versi masalah regresi ridge ini hanya mengarah ke masalah kuadrat terkecil teredam yang sama .min∥Xβ−y∥22+λ∥β∥22