Jika Anda benar-benar bermaksud log-likelihood , maka jawabannya adalah: itu tidak selalu nol.
Misalnya, perhatikan data Poisson: ysaya∼ Poisson ( μsaya) , i = 1 , … , n . Log-kemungkinan untuk Y= ( y1, ... , yn) diberikan oleh:
ℓ ( μ ; Y) = - Âi = 1nμsaya+ ∑i = 1nysayacatatanμsaya- ∑i = 1ncatatan( ysaya! ) .( ∗ )
Bedakan ℓ ( μ ; Y) dalam ( ∗ ) sehubungan dengan μsaya dan atur ke 0 (ini adalah bagaimana kami mendapatkan MLE untuk model jenuh):
- 1 + ysayaμsaya= 0.
Memecahkan ini untuk
μsayauntuk mendapatkan
μ i=yi, menggantikan
μ ikembali ke
(*)untuk
μimemberikan bahwa log-kemungkinan model jenuh adalah:
ℓ( μ ;Y)=n ∑ i=1yi(logyi-1)-n ∑ i=μ^saya= ysayaμ^saya( ∗ )μsayaℓ ( μ^; Y) = ∑i = 1nysaya( logysaya- 1 ) - Âi = 1ncatatan( ysaya! ) ≠ 0
kecuali
ysayamengambil nilai yang sangat istimewa.
Di halaman bantuan R
fungsi glm
, di bawah item deviance
, dokumen menjelaskan masalah ini sebagai berikut:
deviance
hingga konstan, dikurangi dua kali log-likelihood yang dimaksimalkan. Dimana masuk akal, konstanta dipilih sehingga model jenuh memiliki penyimpangan nol.
Perhatikan bahwa disebutkan bahwa penyimpangan , bukan log-kemungkinan model jenuh dipilih menjadi nol.
Mungkin, apa yang Anda benar-benar ingin konfirmasi adalah bahwa " penyimpangan model jenuh selalu diberikan sebagai nol", yang benar, sejak penyimpangan, menurut definisi (lihat Bagian 4.5.1 dari Analisis Data Kategorikal (Edisi 2) oleh Alan Agresti) adalah statistik rasio kemungkinan dari GLM yang ditentukan untuk model jenuh. Yang constant
disebutkan dalam dokumentasi R sebenarnya dua kali log-likelihood yang dimaksimalkan dari model jenuh.
Mengenai pernyataan Anda "Namun, cara rumus penyimpangan diberikan menunjukkan bahwa kadang-kadang jumlah ini tidak nol.", Itu mungkin disebabkan oleh penyalahgunaan penggunaan istilah penyimpangan . Misalnya, di R, statistik rasio kemungkinan membandingkan dua sewenang-wenang model (bersarang) dan M 2 juga disebut sebagai penyimpangan, yang akan lebih tepat disebut sebagai yang perbedaan antara penyimpangan dari M 1 dan penyimpangan dari M 2 , jika kita mengikuti dengan seksama definisi yang diberikan dalam buku Agresti.M.1M.2M.1M.2
Kesimpulan
Log-likelihood dari model jenuh pada umumnya bukan nol.
Penyimpangan (dalam definisi aslinya) dari model jenuh adalah nol.
The penyimpangan Output dari software (seperti R) secara umum non-nol karena itu benar-benar berarti sesuatu yang lain (perbedaan antara deviances).
Berikut ini adalah derivasi untuk kasus keluarga eksponensial umum dan contoh konkret lainnya. Misalkan data berasal dari keluarga eksponensial (lihat Statistik Terapan Modern dengan S , Bab ):
f ( y i ; θ i , φ ) = exp [ A i ( y i θ i - γ ( θ i ) ) / φ + τ ( y i , φ / A i ) ] .7
f( ysaya; θsaya, φ ) = exp[ Asaya( ysayaθsaya- γ( θsaya) ) / φ + τ( ysaya, φ / Asaya) ] .(1)
di mana
diketahui bobot sebelumnya dan
φ adalah parameter dispersi / skala (untuk banyak kasus seperti binomial dan Poisson, parameter ini diketahui, sedangkan untuk kasus lain seperti normal dan Gamma, parameter ini tidak diketahui). Kemudian log-kemungkinan diberikan oleh:
ℓ ( θ , φ ; Y ) = n Σ i = 1 A i ( y i θ i - γ ( θ i ) ) / φ + n Σ i = 1 τSEBUAHsayaφ
Seperti dalam contoh Poisson, parameter model jenuh dapat diperkirakan dengan menyelesaikanfungsi
skorberikut:
0 = U ( θ i ) = ∂ ℓ ( θ , φ ; Y )ℓ ( θ , φ ; Y) = ∑i = 1nSEBUAHsaya( ysayaθsaya- γ( θsaya) ) / φ + ¢i = 1nτ( ysaya, φ / Asaya) .
0 = U( θsaya) = ∂ℓ ( θ , φ ; Y)∂θsaya= Asaya( ysaya- γ′( θsaya) )φ
θ^saya
ℓ ( θ^, φ ;Y) = ∑i = 1nSEBUAHsaya( ysayaθ^saya-γ( θ^saya) ) / φ + ¢i = 1nτ( ysaya, φ / Asaya) .( ∗ ∗ )
( ∗ ∗ )Γ ( α , β)
f( y; α , β) = βαΓ ( α )e- βyyα - 1,y> 0 , α > 0 , β> 0 ,
f( 1 )φ = 1α,θ = - βα,
ff( y; θ , φ ) = exp[ θ y- ( - log( - θ ) )φ+ τ( y, φ ) ] ,
τ( y, φ ) = - logφφ+ ( 1φ- 1 ) logy- logΓ ( φ- 1) .
θ^saya= - 1ysaya∑i = 1n1φ[ θ^sayaysaya- ( - log( - θ^saya) ) ] = Âi = 1n1φ[ - 1 - log( ysaya) ] ≠ 0 ,
ysaya