Interval kepercayaan kemungkinan maksimum
Perkiraan normal untuk sampel Bernoulli bergantung pada memiliki ukuran sampel yang relatif besar dan proporsi sampel yang jauh dari ekor. Estimasi kemungkinan maksimum berfokus pada peluang log-transformed dan ini memberikan interval non-simetris, efisien untuk yang seharusnya digunakan.p
Definisikan log-odds sebagaiβ^0=log(p^/(1−p^))
1- CI untuk diberikan oleh:αβ0
CI(β0)α=β^0±Zα/21/(np^(1−p^)−−−−−−−−−−−√
Dan ini kembali diubah menjadi interval (non-simetris) untuk dengan:p
CI(p)α=1/(1+exp(−CI(β0)α)
CI ini memiliki manfaat tambahan bahwa proporsi terletak pada interval antara 0 atau 1, dan CI selalu lebih sempit daripada interval normal sambil berada pada level yang benar. Anda bisa mendapatkan ini dengan sangat mudah di R dengan menetapkan:
set.seed(123)
y <- rbinom(100, 1, 0.35)
plogis(confint(glm(y ~ 1, family=binomial)))
2.5 % 97.5 %
0.2795322 0.4670450
Interval kepercayaan binomial yang tepat
Dalam sampel kecil, perkiraan normal untuk MLE - sementara lebih baik daripada perkiraan normal untuk proporsi sampel - mungkin tidak dapat diandalkan. Tidak apa-apa. dapat diambil untuk mengikuti kepadatan binomial . Batas untuk dapat ditemukan dengan mengambil persentil ke 2.5 dan 97.5 dari distribusi ini.Y=np^(n,p)p^
CIα=(F−1p^(0.025),F−1p^(0.975))
Jarang mungkin dilakukan dengan tangan, interval kepercayaan binomial yang tepat dapat diperoleh untuk menggunakan metode komputasi.p
qbinom(p = c(0.025, 0.975), size = length(y), prob = mean(y))/length(y)
[1] 0.28 0.47
Interval kepercayaan bias rata-rata
Dan jika adalah 0 atau 1 tepat, penaksir rata-rata median dapat digunakan untuk mendapatkan estimasi interval non-singular berdasarkan fungsi probabilitas rata-rata tidak bias. Anda dapat dengan mudah mengambil batas bawah dari case all-0 sebagai 0 WLOG. Batas atas adalah proporsi yang memenuhi:pp1−α/2
p1−α/2:P(Y=0)/2+P(Y>y)>0.975
Ini juga merupakan rutinitas komputasi.
set.seed(12345)
y <- rbinom(100, 1, 0.01) ## all 0
cil <- 0
mupfun <- function(p) {
0.5*dbinom(0, 100, p) +
pbinom(1, 100, p, lower.tail = F) -
0.975
} ## for y=0 successes out of n=100 trials
ciu <- uniroot(mupfun, c(0, 1))$root
c(cil, ciu)
[1] 0.00000000 0.05357998 ## includes the 0.01 actual probability
Dua metode terakhir diimplementasikan dalam epitools
paket di R.