Singkatnya, argumen Birnbaum adalah bahwa dua prinsip yang diterima secara luas menyiratkan bahwa prinsip kemungkinan harus dipegang. Argumen kontra Mayo adalah bahwa buktinya salah karena Birnbaum menyalahgunakan salah satu prinsip.
Di bawah ini saya menyederhanakan argumen sejauh mereka tidak terlalu keras. Tujuan saya adalah membuat mereka dapat diakses oleh audiens yang lebih luas karena argumen aslinya sangat teknis. Pembaca yang tertarik harus melihat detail dalam artikel yang terhubung dalam pertanyaan dan komentar.
Demi konkret, saya akan fokus pada kasus koin dengan bias yang tidak diketahui θ . Dalam percobaan E1 kami membalikkannya 10 kali. Dalam percobaan E2 kita membalikkannya sampai kita mendapatkan 3 "ekor". Dalam percobaan Emix kita melempar koin yang adil berlabel "1" dan "2": jika mendaratkan "1" kita melakukan E1 ; jika mendarat "2" kami melakukan E2 . Contoh ini akan sangat menyederhanakan diskusi dan akan menunjukkan logika argumen (bukti asli tentu saja lebih umum).
Prinsip-prinsip:
Dua prinsip berikut diterima secara luas:
The Kondisionalitas Prinsip Lemah mengatakan bahwa kita harus menarik kesimpulan yang sama jika kita memutuskan untuk melakukan percobaan E1 , atau jika kita memutuskan untuk melakukan Emix dan koin mendarat "1".
Prinsip Kecukupan mengatakan bahwa kita harus menarik kesimpulan yang sama dalam dua percobaan di mana statistik yang cukup memiliki nilai yang sama.
Prinsip berikut diterima oleh Bayesian tetapi tidak oleh frequentist. Namun, Birnbaum mengklaim bahwa itu adalah konsekuensi logis dari dua yang pertama.
Prinsip Likelihood mengatakan bahwa kita harus menarik kesimpulan yang sama dalam dua percobaan di mana fungsi kemungkinan proporsional.
Teorema Birnbaum:
Katakanlah kita melakukan E1 dan kita mendapatkan 7 "head" dari sepuluh flips. Fungsi likelihood dari θ adalah . Kami melakukan dan membalik koin 10 kali untuk mendapatkan 3 "ekor". Fungsi likelihood dari adalah . Dua fungsi kemungkinan bersifat proporsional.(103)θ7(1−θ)3E2θ(97)θ7(1−θ)3
Birnbaum mempertimbangkan statistik berikut ini pada dari hingga :
mana dan masing-masing adalah jumlah "kepala" dan "ekor". Jadi, apa pun yang terjadi, melaporkan hasilnya seolah-olah itu berasal dari percobaan . Ternyata cukup untuk di . Satu-satunya kasus yang tidak sepele adalah ketika dan , di mana kita milikiEmix{1,2}×N2{1,2}×N2T:(ξ,x,y)→(1,x,y),
xyTE1TθEmixx=7y=3
P(Xmix=(1,x,y)|T=(1,x,y))=0.5×(103)θ7(1−θ)30.5×(103)θ7(1−θ)3+0.5×(97)θ7(1−θ)3=(103)(103)+(97).
Semua kasus lainnya adalah 0 atau 1 - kecuali , yang merupakan komplemen dari probabilitas di atas. Distribusi diberikan tidak tergantung pada , jadi adalah statistik yang cukup untuk .P(Xmix=(2,x,y)|T=(1,x,y))XmixTθTθ
Sekarang, sesuai dengan prinsip kecukupan, kita harus menyimpulkan hal yang sama untuk dan dalam , dan dari prinsip kondisionalitas yang lemah, kita harus menyimpulkan hal yang sama untuk di dan di , serta untuk di dan di . Jadi kesimpulan kita harus sama dalam semua kasus, yang merupakan prinsip kemungkinan.(1,x,y)(2,x,y)Emix(x,y)E1(1,x,y)Emix(x,y)E2(2,x,y)Emix
Mayo kontra-bukti:
Pengaturan Birnbaum bukanlah percobaan campuran karena hasil dari koin berlabel "1" dan "2" tidak diamati , oleh karena itu prinsip kondisionalitas yang lemah tidak berlaku untuk kasus ini .
Ikuti tes versus dan menarik kesimpulan dari nilai p tes. Sebagai pengamatan awal, perhatikan bahwa nilai p dalam diberikan oleh distribusi binomial sekitar ; nilai p dalam diberikan oleh distribusi binomial negatif sekitar .θ=0.5θ>0.5(7,3)E10.1719(7,3)E20.0898
Inilah bagian penting: nilai p dari dalam diberikan sebagai rata-rata dari keduanya - ingat kita tidak tahu status koin - yaitu sekitar . Namun nilai p dalam - tempat koin diamati - sama dengan yang ada di , yaitu sekitar . Prinsip kondisionalitas yang lemah berlaku (kesimpulannya sama di dan di mana koin mendarat "1") namun prinsip kemungkinan tidak. Contoh tandingan membantah teorema Birnbaum.T=(1,7,3)Emix 0,1309 ( 1 , 7 , 3 ) E m i x E 1 0,1719 E 1 E m i x0.1309(1,7,3)EmixE10.1719E1Emix
Penolakan Peña dan Berger atas bukti pembalasan Mayo:
Mayo secara implisit mengubah pernyataan prinsip kecukupan: dia menafsirkan "kesimpulan yang sama" sebagai "metode yang sama". Mengambil nilai-p adalah metode inferensi, tetapi bukan kesimpulan.
Prinsip kecukupan mengatakan bahwa jika ada statistik yang cukup, maka kesimpulannya harus sama, tetapi tidak memerlukan statistik yang cukup untuk digunakan sama sekali. Jika ya, itu akan menimbulkan kontradiksi, seperti yang ditunjukkan oleh Mayo.