Keith Winstein,
EDIT: Hanya untuk memperjelas, jawaban ini menggambarkan contoh yang diberikan dalam Jawaban Keith Winstein pada Raja dengan permainan statistik yang kejam. Jawaban Bayesian dan Frequentist keduanya menggunakan informasi yang sama, yaitu untuk mengabaikan informasi tentang jumlah koin yang adil dan tidak adil ketika membangun interval. Jika informasi ini tidak diabaikan, frequentist harus menggunakan Beta-Binomial Likelihood yang terintegrasi sebagai distribusi sampel dalam membangun interval Keyakinan, di mana Interval Keyakinan Clopper-Pearson tidak sesuai, dan perlu dimodifikasi. Penyesuaian serupa harus terjadi dalam solusi Bayesian.
EDIT: Saya juga telah mengklarifikasi penggunaan awal clopper Interval Pearson.
EDIT: sayangnya, alfa saya salah jalan, dan interval pearson clopper saya salah. Permintaan maaf saya yang paling rendah kepada @whuber, yang dengan benar menunjukkan hal ini, tetapi pada awalnya saya tidak setuju dan mengabaikannya.
CI Menggunakan metode Clopper Pearson sangat baik
Jika Anda hanya mendapatkan satu pengamatan, maka Interval Clopper Pearson dapat dievaluasi secara analitis. Misalkan koin muncul sebagai "sukses" (kepala) Anda harus memilih sedemikian rupaθ
[ Pr ( B i ( 1 , θ ) ≥ X) ≥ α2] ∩ [ P.r ( B i ( 1 , θ ) ≤ X) ≥ α2]
Ketika probabilitas ini adalah P r ( B i ( 1 , θ ) ≥ 1 ) = θ dan P r ( B i ( 1 , θ ) ≤ 1 ) = 1 , sehingga Clopper Pearson CI menyiratkan bahwa θ ≥ αX= 1Pr ( B i ( 1 , θ ) ≥ 1 ) = θPr ( B i ( 1 , θ ) ≤ 1 ) = 1 (dan yang sepele selalu benar1≥αθ ≥ α2 ) ketikaX=1 ≥ α2 . Ketika X = 0 probabilitas ini adalah P r ( B i ( 1 , θ ) ≥ 0 ) = 1 dan P r ( B i ( 1 , θ ) ≤ 0 ) = 1 - θ , sehingga Clopper Pearson CI menyiratkan bahwa 1 - θ ≥ αX= 1X= 0Pr ( B i ( 1 , θ ) ≥ 0 ) = 1Pr ( B i ( 1 , θ ) ≤ 0 ) = 1 - θ , atauθ≤1-α1 - θ ≥ α2 saatX=0. Jadi untuk CI 95% kita mendapatkan[0,025,1]ketikaX=1, dan[0,0,975]ketikaX=0.θ ≤ 1 - α2X= 0[ 0,025 , 1 ]X= 1[ 0 , 0,975 ]X= 0
Dengan demikian, orang yang menggunakan Interval Kepercayaan Clopper Pearson tidak akan pernah dipenggal. Setelah mengamati interval, pada dasarnya seluruh ruang parameter. Tetapi interval CP melakukan ini dengan memberikan cakupan 100% ke interval yang seharusnya 95%! Pada dasarnya, para Frequentists "menipu" dengan memberikan interval kepercayaan 95% lebih banyak cakupan daripada yang diminta (meskipun siapa yang tidak akan menipu dalam situasi seperti itu? Jika itu saya, saya akan memberikan keseluruhan [0, 1] interval). Jika raja meminta 95% CI secara tepat , metode kerap kali ini akan gagal terlepas dari apa yang sebenarnya terjadi (mungkin ada yang lebih baik?).
Bagaimana dengan Interval Bayesian? (khususnya Bayesian Interval Posterior Desnity Tertinggi (HPD))
Karena kita tahu apriori bahwa kepala dan ekor dapat muncul, seragam sebelumnya adalah pilihan yang masuk akal. Ini memberikan distribusi posterior dari . Sekarang, yang perlu kita lakukan sekarang adalah membuat interval dengan probabilitas posterior 95%. Mirip dengan clopper pearson CI, distribusi Cummulative Beta juga bersifat analitik, sehingga P r ( θ ≥ θ e | x = 1 ) = 1 -(θ|X)∼Beta(1+X,2−X) dan P r ( θ ≤ θ e | x = 0 ) = 1 - ( 1 - θ e ) 2 pengaturan ini ke 0,95 memberikan θ e = √Pr(θ≥θe|x=1)=1−(θe)2Pr(θ≤θe|x=0)=1−(1−θe)2ketikaX=1danθ e =1- √θe=0.05−−−−√≈0.224X=1ketikaX=0. Jadi dua interval yang kredibel adalah(0,0,776)ketikaX=0dan(0,224,1)ketikaX=1θe=1−0.05−−−−√≈0.776X=0(0,0.776)X=0( 0,224 , 1 )X= 1
Dengan demikian Bayesian akan dipenggal kepalanya karena interval Kredibel HPDnya dalam kasus ketika ia mendapatkan koin buruk dan koin Buruk muncul ekor yang akan muncul dengan peluang .11012+ 1× 110≈ 0
Pengamatan pertama, Interval Bayesian lebih kecil dari interval kepercayaan. Hal lain adalah bahwa Bayesian akan lebih dekat dengan cakupan aktual yang dinyatakan, 95%, daripada yang sering terjadi. Bahkan, Bayesian hampir mendekati cakupan 95% seperti yang bisa didapat dalam masalah ini. Dan bertentangan dengan pernyataan Keith, jika koin buruk dipilih, 10 Bayesian dari 100 rata-rata akan kehilangan kepala mereka (tidak semua dari mereka, karena koin buruk harus muncul kepala untuk interval agar tidak mengandung ). 0,1
0,0250,975
Mengutip interval kepercayaan 95% asli , maka dengan definisi harus ada beberapa kasus (yaitu setidaknya satu) dari interval yang diamati yang tidak mengandung nilai sebenarnya dari parameter . Kalau tidak, bagaimana orang bisa membenarkan tag 95%? Bukankah hanya valid atau tidak valid untuk menyebutnya interval 90%, 50%, 20%, atau bahkan 0%?
Saya tidak melihat betapa sederhana menyatakan "itu sebenarnya berarti 95% atau lebih" tanpa batasan gratis memuaskan. Ini karena solusi matematika yang jelas adalah seluruh ruang parameter, dan masalahnya sepele. misalkan saya ingin 50% CI? jika hanya membatasi negatif palsu maka seluruh ruang parameter adalah CI yang valid dengan hanya menggunakan kriteria ini.
100%X= 0100 × 1012+ 9101012+ 1% > 95%X= 1
Sebagai penutup, tampaknya agak aneh untuk meminta interval ketidakpastian, dan kemudian mengevaluasi interval itu dengan menggunakan nilai sebenarnya yang kami tidak yakin tentang. Sebuah perbandingan yang "lebih adil", untuk interval kepercayaan dan interval yang kredibel, bagi saya tampaknya seperti kebenaran pernyataan ketidakpastian yang diberikan dengan interval .