Model regresi linier
, di mana ϵ ∼ N ( 0 , I σ 2 )Y= Xβ+ ϵϵ ∼ N( 0 , sayaσ2)
, X ∈ R n × p dan β ∈ R pY∈ RnX∈ Rn × pβ∈ Rhal
Perhatikan bahwa kesalahan model kami (residual) adalah . Tujuan kami adalah menemukan vektor β s yang meminimalkan norma L 2 yang dikuadratkan dari kesalahan ini.ϵ = Y - X ββL.2
Kotak Terkecil
Data yang diberikan mana setiap x i adalah dimensi p , kami berusaha menemukan:( x1, y1) , . . . , ( xn, yn)xsayahal
βˆL S= argminβ| | ϵ | |2= argminβ| | Y - X β| |2= argminβ∑i = 1n( ysaya- xsayaβ)2
Kemungkinan Maksimum
Menggunakan model di atas, kita dapat mengatur kemungkinan data diberikan parameter sebagai:β
L ( Y| X, β) = ∏i = 1nf( ysaya| xsaya, β)
di mana adalah pdf dari distribusi normal dengan mean 0 dan varians σ 2 . Memasukkannya ke:f( ysaya| xsaya, β)σ2
L ( Y| X, β) = ∏i = 1n12 πσ2----√e- ( ysaya- xsayaβ)22 σ2
Sekarang umumnya ketika berhadapan dengan kemungkinan secara matematis lebih mudah untuk mengambil log sebelum melanjutkan (produk menjadi jumlah, eksponensial hilang), jadi mari kita lakukan itu.
catatanL ( Y| X, β) = ∑i = 1ncatatan( 12 πσ2----√) - ( ysaya- xsayaβ)22 σ2
Karena kami menginginkan estimasi kemungkinan maksimum, kami ingin menemukan maksimum persamaan di atas, berkenaan dengan . Istilah pertama tidak memengaruhi estimasi kami tentang β , jadi kami dapat mengabaikannya:ββ
βˆM.L E= argmaxβ∑i = 1n- ( ysaya- xsayaβ)22 σ2
Perhatikan bahwa penyebutnya adalah konstan sehubungan dengan . Akhirnya, perhatikan bahwa ada tanda negatif di depan jumlah tersebut. Jadi menemukan maksimum angka negatif adalah seperti menemukan minimumnya tanpa negatif. Dengan kata lain:β
βˆM.L E= argminβ∑i = 1n( ysaya- xsayaβ)2= βˆL S
Ingat bahwa agar ini berfungsi, kami harus membuat asumsi model tertentu (normalitas istilah kesalahan, 0 mean, varians konstan). Ini membuat kuadrat terkecil setara dengan MLE dalam kondisi tertentu. Lihat di sini dan di sini untuk diskusi lebih lanjut.
Untuk kelengkapan, perhatikan bahwa solusinya dapat ditulis sebagai:
β= ( XTX )- 1XTy