NB residual penyimpangan (atau Pearson) tidak diharapkan memiliki distribusi normal kecuali untuk model Gaussian. Untuk kasus regresi logistik, seperti @Stat mengatakan, residu penyimpangan untuk th pengamatan diberikan olehiyi
rDi=−2|log(1−π^i)|−−−−−−−−−−−√
jika &yi=0
rDi=2|log(π^i)|−−−−−−−−√
jika , di mana adalah probabilitas Bernoulli yang cocok. Karena masing-masing hanya dapat mengambil satu dari dua nilai, jelas distribusinya tidak bisa normal, bahkan untuk model yang ditentukan dengan benar:yi=1πi^
#generate Bernoulli probabilities from true model
x <-rnorm(100)
p<-exp(x)/(1+exp(x))
#one replication per predictor value
n <- rep(1,100)
#simulate response
y <- rbinom(100,n,p)
#fit model
glm(cbind(y,n-y)~x,family="binomial") -> mod
#make quantile-quantile plot of residuals
qqnorm(residuals(mod, type="deviance"))
abline(a=0,b=1)
Tetapi jika ada replikasi pengamatan untuk pola prediktor ke- , & residu penyimpangan didefinisikan untuk mengumpulkan ininii
rDi=sgn(yi−niπ^i)2[yilogyinπ^i+(ni−yi)logni−yini(1−π^i)]−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−√
(di mana sekarang adalah hitungan keberhasilan dari 0 hingga ) maka ketika semakin besar distribusi residu lebih mendekati normalitas:n i n iyinini
#many replications per predictor value
n <- rep(30,100)
#simulate response
y<-rbinom(100,n,p)
#fit model
glm(cbind(y,n-y)~x,family="binomial")->mod
#make quantile-quantile plot of residuals
qqnorm(residuals(mod, type="deviance"))
abline(a=0,b=1)
Hal-hal serupa untuk Poisson atau GLM binomial negatif: untuk jumlah prediksi yang rendah distribusi residu diskrit & miring, tetapi cenderung normal untuk jumlah yang lebih besar di bawah model yang ditentukan dengan benar.
Tidak biasa, setidaknya tidak di leher saya di hutan, untuk melakukan tes formal normal residual; jika pengujian normalitas pada dasarnya tidak berguna ketika model Anda mengasumsikan normalitas yang tepat, maka fortiori itu tidak berguna ketika tidak. Namun demikian, untuk model tak jenuh, diagnostik residual grafis berguna untuk menilai keberadaan & sifat kurang fit, mengambil normalitas dengan cubitan atau segenggam garam tergantung pada jumlah ulangan per pola prediktor.