Penyimpangan adalah konsep GLM, model ZIP dan ZINB bukan glm tetapi diformulasikan sebagai campuran distribusi yang terbatas yang merupakan GLM dan karenanya dapat diselesaikan dengan mudah melalui algoritma EM.
Catatan-catatan ini menggambarkan teori penyimpangan secara ringkas. Jika Anda membaca catatan itu, Anda akan melihat bukti bahwa model jenuh untuk regresi Poisson memiliki kemungkinan log
ℓ ( λs) = ∑i = 1 , ∀ ysaya≠ 0n[ ysayal o g( ysaya) - ysaya- l o g( ysaya! ) ]
yang hasil dari plug-in perkiraan .ysaya= λ^saya
Saya akan melanjutkan sekarang dengan kemungkinan ZIP karena matematika lebih sederhana, hasil yang sama berlaku untuk ZINB. Sayangnya untuk ZIP, tidak ada hubungan sederhana seperti di Poisson. The pengamatan th log-kemungkinan adalahsaya
ℓsaya( ϕ , λ ) = Zsayal o g( ϕ + ( 1 - ϕ ) e- λ) + ( 1 - Zsaya) [ - λ + ysayal o g( Λ ) - l o g( ysaya! ) ] .
yang tidak diamati sehingga untuk mengatasi ini Anda akan perlu mengambil derivatif parsial wrt baik λ dan φ , mengatur persamaan untuk 0 dan kemudian memecahkan λ dan φ . Kesulitan di sini adalah y i = 0 nilai-nilai, ini bisa masuk ke λ atau menjadi φ dan tidak mungkin tanpa mengamati Z i yang menempatkan y i = 0 observasi ke dalam. Namun, jika kita tahu Z iZsayaλϕλϕysaya= 0λ^ϕ^Zsayaysaya= 0Zsayanilai kami tidak akan memerlukan model ZIP karena kami tidak akan memiliki data yang hilang. Data yang diamati sesuai dengan kemungkinan "data lengkap" dalam formalisme EM.
Salah satu pendekatan yang mungkin masuk akal adalah bekerja dengan ekspektasi wrt dari kemungkinan log data lengkap, E ( ℓ i ( ϕ , λ ) ) yang menghilangkan Z i dan menggantikannya dengan ekspektasi, ini adalah bagian dari apa yang Algoritma EM menghitung (langkah E) dengan pembaruan terkini. Saya tidak tahu ada literatur yang telah mempelajari pendekatan ini untuk e x p e c t e d penyimpangan sekalipun.ZsayaE ( ℓsaya( ϕ , λ ) )Zsayae x p e c t e d
Juga, pertanyaan ini ditanyakan terlebih dahulu sehingga saya menjawab posting ini. Namun, ada pertanyaan lain tentang topik yang sama dengan komentar yang bagus dari Gordon Smyth di sini:
penyimpangan untuk model poisson majemuk nol, data kontinu (R) di
mana ia menyebutkan respons yang sama (ini adalah penjabaran dari komentar yang saya akan katakan) ditambah mereka disebutkan dalam komentar ke posting lain makalah yang mungkin ingin Anda baca. (penafian, saya belum membaca makalah yang direferensikan)