Seperti yang ditunjukkan oleh kjetil b halvorsen, itu adalah, dengan caranya sendiri, sebuah keajaiban bahwa regresi linier mengakui solusi analitis. Dan ini hanya berdasarkan linearitas masalah (berkenaan dengan parameter). Dalam OLS, Anda memiliki
yang memiliki kondisi urutan pertama
- 2 Σ i ( y i - x ' i β ) x i = 0
Untuk masalah dengan p
∑i(yi−x′iβ)2→minβ,
−2∑i(yi−x′iβ)xi=0
pvariabel (termasuk konstan, jika perlu — ada beberapa regresi melalui masalah asal juga), ini adalah sistem dengan
persamaan dan
p tidak diketahui. Yang paling penting, ini adalah sistem linear, sehingga Anda dapat menemukan solusi menggunakan
teori dan praktik aljabar linear standar . Sistem ini akan memiliki solusi dengan probabilitas 1 kecuali Anda memiliki variabel collinear sempurna.
pp
Sekarang, dengan regresi logistik, segalanya menjadi tidak mudah lagi. Menuliskan fungsi log-likelihood,
dan mengambil turunannya untuk menemukan MLE, kita dapatkan
∂ l
l ( y; x , β) = ∑sayaysayadalamhalsaya+ ( 1 - ysaya) ln( 1 - halsaya) ,halsaya= ( 1 + exp( - θsaya) )- 1,θsaya= x′sayaβ,
Parameter
βmemasukkan ini dengan cara yang sangat nonlinier: untuk setiap
i, ada fungsi nonlinear, dan mereka ditambahkan bersama-sama. Tidak ada solusi analitis (kecuali mungkin dalam situasi sepele dengan dua pengamatan, atau sesuatu seperti itu), dan Anda harus menggunakan
metode optimasi nonlinieruntuk menemukan perkiraan
ß .
∂l∂β′= ∑sayad psayad θ( ysayahalsaya- 1 - ysaya1 - halsaya) xsaya= ∑saya[ ysaya- 11 + exp( x′sayaβ)] xsaya
βsayaβ^
Pandangan yang agak lebih dalam ke masalah (mengambil turunan kedua) mengungkapkan bahwa ini adalah masalah optimisasi cembung untuk menemukan maksimum fungsi cekung (parabola multivariat yang dimuliakan), sehingga salah satunya ada, dan setiap algoritma yang masuk akal harus menemukannya daripada dengan cepat, atau segalanya meledak hingga tak terbatas. Yang terakhir tidak terjadi logistik regresi ketika untuk beberapa cP r o b [ Ysaya= 1 | x′sayaβ> c ] = 1c, yaitu, Anda memiliki prediksi yang sempurna. Ini adalah artefak yang agak tidak menyenangkan: Anda akan berpikir bahwa ketika Anda memiliki prediksi yang sempurna, modelnya bekerja dengan sempurna, tetapi cukup aneh, itu sebaliknya.