Apa hubungan antara wilayah yang kredibel dan tes hipotesis Bayesian?


38

Dalam statistik frequentist, ada hubungan erat antara interval kepercayaan dan tes. Menggunakan inferensi tentang dalam distribusi sebagai contoh, interval kepercayaan berisi semua nilai yang tidak ditolak oleh uji- pada tingkat signifikansi .μN(μ,σ2)1α

x¯±tα/2(n1)s/n
μtα

Interval kepercayaan sering dalam tes terbalik ini. (Kebetulan, ini berarti bahwa kita dapat menginterpretasikan nilai sebagai nilai terkecil dari yang nilai null dari parameter akan dimasukkan dalam interval kepercayaan . Saya menemukan bahwa ini bisa menjadi cara yang berguna untuk jelaskan apa nilai- sebenarnya bagi orang yang tahu sedikit statistik.)pα1αp

Membaca tentang fondasi teoretis-keputusan dari wilayah Bayesian yang kredibel , saya mulai bertanya-tanya apakah ada hubungan / kesetaraan yang sama antara wilayah yang kredibel dan tes Bayesian.

  • Apakah ada koneksi umum?
  • Jika tidak ada koneksi umum, apakah ada contoh di mana ada koneksi?
  • Jika tidak ada koneksi umum, bagaimana kita bisa melihatnya?

Sebuah pertanyaan terkait yang telah saya tanyakan - bisakah seseorang mengarahkan saya ke sebuah makalah yang mereka anggap sebagai "standar emas" atau "contoh kanonik" dari pengujian hipotesis Bayesian yang digunakan pada masalah nyata, dan bukan contoh mainan. Saya tidak pernah benar-benar memahami pengujian hipotesis Bayesian dan saya pikir saya akan menemukan contoh yang baik tentang penggunaannya yang instruktif.
Patrick Caldon

2
@ PatrickCaldon Saya ragu ada "kertas emas" tentang ini karena pengujian hipotesis Bayesian dirumuskan dalam kerangka kerja teori-keputusan (oleh karena itu terlalu luas untuk ditangkap dalam satu kertas tunggal). Buku yang disebutkan dalam jawaban MånsT memberikan bahan yang baik, buku-buku dan pembicaraan Berger mungkin juga menarik.

Saya percaya makalah ba.stat.cmu.edu/vol03is01.php dapat mengklarifikasi sebagian besar diskusi kita di sini.
Carlos AB Pereira

Terima kasih, @Carlos! Tautan sepertinya tidak berfungsi saat ini, tapi saya kira itu mengarah ke makalah 2008 Anda di Bayesian Analysis with Stern dan Wechsler. Saya menemukan bahwa bacaan yang sangat menarik!
MånsT

Yang terhormat MånsT: Analisis Bayesian pindah ke Project Euclid. Makalah Prof. Carlos ada di sini: projecteuclid.org/...
Zen

Jawaban:


19

Saya berhasil menemukan contoh di mana koneksi ada. Tampaknya sangat tergantung pada pilihan saya fungsi kerugian dan penggunaan hipotesis komposit.

Saya mulai dengan contoh umum, yang kemudian diikuti oleh kasus khusus sederhana yang melibatkan distribusi normal.

Contoh umum

Untuk parameter yang tidak diketahui , biarkan menjadi ruang parameter dan pertimbangkan hipotesis versus alternatif .Θ θ Θ 0 θ Θ 1 = Θ Θ 0θΘθΘ0θΘ1=ΘΘ0

Mari menjadi fungsi tes, menggunakan notasi di Xi'an 's The Bayesian Choice (yang merupakan semacam mundur dengan apa yang saya setidaknya sudah terbiasa), sehingga kita menolak jika dan menerima jika . Pertimbangkan fungsi kerugian Tes Bayes kemudianΘ 0 φ = 0 Θ 0 φ = 1 L ( θ , φ ) = { 0 , jika  φ = I Θ 0 ( θ ) a 0 , jika  θ Θ 0  dan  φ = 0 a 1 , jika  θ Θ 1  dan  φ = 1. φ π ( x ) =φΘ0φ=0Θ0φ=1

L(θ,φ)={0,if φ=IΘ0(θ)a0,if θΘ0 and φ=0a1,if θΘ1 and φ=1.
φπ(x)=1ifP(θΘ0|x)a1(a0+a1)1.

Ambil dan . Hipotesis nol diterima jika .a 1 = 1 - α Θ 0 P ( θ Θ 0 | x ) 1 - αa0=α0.5a1=1αΘ0P(θΘ0|x)1α

Sekarang, wilayah kredibel adalah wilayah sedemikian rupa sehingga . Jadi, menurut definisi, jika sedemikian rupa sehingga , dapat menjadi wilayah yang kredibel hanya jika . P ( Θ c | x ) 1 - α Θ 0 P ( θ Θ 0 | x ) 1 - α Θ c P ( Θ 0Θ c | x ) > 0ΘcP(Θc|x)1αΘ0P(θΘ0|x)1αΘcP(Θ0Θc|x)>0

Kami menerima hipotesis nol jika satu-satunya jika setiap wilayah kredibel berisi subset non-null dari .Θ 01αΘ0

Kasus khusus yang lebih sederhana

Untuk mengilustrasikan tes seperti apa yang kami miliki dalam contoh di atas, pertimbangkan kasus khusus berikut.

Biarkan dengan . Set , dan , sehingga kami ingin menguji apakah .θ N ( 0 , 1 ) Θ = R Θ 0 = ( - , 0 ] Θ 1 = ( 0 , ) θ 0xN(θ,1)θN(0,1)Θ=RΘ0=(,0]Θ1=(0,)θ0

Perhitungan standar memberikan mana adalah cdf normal standar.Φ()

P(θ0|x)=Φ(x/2),
Φ()

Biarkan menjadi sedemikian rupa sehingga . diterima ketika . Φ ( z 1 - α ) = 1 - α Θ 0 - x / z1αΦ(z1α)=1αΘ0x/2>z1α

Ini sama dengan menerima ketikaKarena , karena itu ditolak ketika .α=0,05Θ0x>-2,33x2zα.α=0.05Θ0x>2.33

Jika sebaliknya kita menggunakan , ditolak ketika .Θ 0 x > - 2.33 - νθN(ν,1)Θ0x>2.33ν

Komentar

Fungsi kerugian di atas, di mana kami berpikir bahwa menerima hipotesis nol secara palsu lebih buruk daripada menolaknya secara palsu, mungkin pada pandangan pertama tampak seperti yang sedikit buatan. Namun hal itu dapat sangat bermanfaat dalam situasi di mana "negatif palsu" bisa mahal, misalnya ketika menyaring penyakit menular berbahaya atau teroris.

Kondisi bahwa semua wilayah yang kredibel harus mengandung bagian dari sebenarnya sedikit lebih kuat daripada yang saya harapkan: dalam kasus yang sering terjadi, korespondensi adalah antara satu tes dan satu interval kepercayaan dan bukan antara satu menguji dan semua interval . 1 - α 1 - αΘ01α1α


2
+1 Saya akan menggunakan wilayah kredibilitas alih-alih interval kredibilitas .

1
Terima kasih @Prastrastator! Saya telah mengedit jawaban dan mengubahnya ke "wilayah" saat saya mengerjakannya. Saya kebanyakan bekerja dengan wilayah HPD dari posisi unimodal, jadi saya cenderung menganggap wilayah kepercayaan sebagai interval. :)
MånsT

12

Michael dan Fraijo menyarankan bahwa hanya memeriksa apakah nilai parameter dari minat terkandung dalam beberapa wilayah yang kredibel adalah setara Bayesian dari interval kepercayaan pembalik. Saya agak skeptis tentang ini pada awalnya, karena tidak jelas bagi saya bahwa prosedur ini benar-benar menghasilkan tes Bayesian (dalam arti biasa).

Ternyata, itu terjadi - setidaknya jika Anda bersedia menerima jenis fungsi kerugian tertentu. Terima kasih banyak kepada Zen , yang menyediakan referensi ke dua makalah yang membangun koneksi antara wilayah HPD dan pengujian hipotesis:

Saya akan mencoba merangkumnya di sini, untuk referensi di masa mendatang. Dalam analog dengan contoh dalam pertanyaan asli, saya akan memperlakukan kasus khusus di mana hipotesisnya adalah mana adalah ruang parameter.Θ

H0:θΘ0={θ0}andH1:θΘ1=ΘΘ0,
Θ

Pereira & Stern mengusulkan metode untuk menguji hipotesis tersebut tanpa harus meletakkan probabilitas sebelumnya pada danΘ 1Θ0Θ1 .

Biarkan menunjukkan fungsi kerapatan dan tentukanθ T ( x ) = { θ : π ( θ | x ) > π ( θ 0 | x ) } .π()θ

T(x)={θ:π(θ|x)>π(θ0|x)}.

Ini berarti bahwa adalah wilayah HPD , dengan kredibilitas .T(x)P(θT(x)|x)

Tes Pereira-Stern menolak ketika adalah "kecil" ( , katakanlah). Untuk posterior unimodal, ini berarti bahwa jauh di ekor posterior, membuat kriteria ini agak mirip dengan menggunakan nilai-p. Dengan kata lain, ditolak di level jika dan hanya jika tidak terdapat di wilayah HPD . P ( θ T ( x ) | x ) < 0,05 θ 0 Θ 0 5 % 95 %Θ0P(θT(x)|x)<0.05θ0Θ05 %95 %

Biarkan fungsi tes menjadi jika diterima dan jika ditolak. Madruga et al. mengusulkan fungsi kerugian dengan .1 Θ 0 0 Θ 0 L ( θ , φ , x ) = { a ( 1 - I ( θ T ( x ) ) , jika  φ ( x ) = 0 b + c I ( θ ( T ( x )) ) , jika  φ ( x ) = 1 , aφ1Θ00Θ0

L(θ,φ,x)={a(1I(θT(x)),if φ(x)=0b+cI(θ(T(x)),if φ(x)=1,
a,b,c>0

Meminimalkan kerugian yang diharapkan mengarah ke tes Pereira-Stern di mana ditolak jikaΘ0P(θT(x)|x)<(b+c)/(a+c).

Sejauh ini, semuanya baik-baik saja. Tes Pereira-Stern sama dengan memeriksa apakah berada di wilayah HPD dan ada fungsi kerugian yang menghasilkan tes ini, yang berarti bahwa tes ini didasarkan pada teori keputusan.θ0

Bagian yang kontroversial adalah bahwa fungsi kerugian tergantung padax . Sementara fungsi kerugian seperti itu telah muncul dalam literatur beberapa kali, mereka tampaknya tidak diterima secara umum sebagai sangat masuk akal.

Untuk membaca lebih lanjut tentang topik ini, lihat daftar makalah yang mengutip Madruga et al. artikel .


Pembaruan Oktober 2012:

Saya tidak sepenuhnya puas dengan fungsi kerugian di atas, karena ketergantungannya pada membuat pengambilan keputusan lebih subjektif daripada yang saya inginkan. Saya menghabiskan lebih banyak waktu untuk memikirkan masalah ini dan akhirnya menulis catatan pendek tentang hal itu, diposting di arXiv sebelumnya hari ini .x

Misalkan menunjukkan fungsi kuantil posterior dari , sehingga . Alih-alih set HPD kami mempertimbangkan interval pusat (sama-tailed) . Untuk menguji menggunakan interval ini dapat dibenarkan dalam kerangka kerja decision-theoretic tanpa fungsi kerugian yang tergantung pada .qα(θ|x)θP(θqα(θ|x))=α(qα/2(θ|x),q1α/2(θ|x))Θ0x

Triknya adalah merumuskan kembali masalah pengujian hipotesis titik-nol sebagai masalah tiga keputusan dengan kesimpulan terarah. kemudian diuji terhadap dan .Θ0={θ0}Θ0Θ1={θ:θ<θ0}Θ1={θ:θ>θ0}

Biarkan fungsi tes jika kita menerima (perhatikan bahwa notasi ini adalah kebalikan dari yang digunakan di atas!). Ternyata di bawah fungsi kerugian tertimbang the Bayes Tes adalah untuk menolak jika tidak dalam interval pusat.φ=iΘi01

L2(θ,φ)={0,if θΘi and φ=i,i{1,0,1},α/2,if θΘ0 and φ=0,1,if θΘiΘ0 and φ=i,i{1,1},
Θ0θ0

Ini sepertinya fungsi kerugian yang cukup masuk akal bagi saya. Saya membahas kerugian ini, kehilangan dan pengujian Madruga-Esteves-Wechsler menggunakan set yang kredibel lebih lanjut dalam naskah di arXiv.


2
(Saya menandai ini sebagai wiki komunitas)
MånsT

Ketika Anda mengatakan "Untuk sampai pada tes Pereira-Stern kita harus meminimalkan kerugian posterior yang diharapkan", well, sebenarnya kita melakukan itu dalam prosedur keputusan Bayesian. Perbedaannya di sini adalah bahwa fungsi kerugian tergantung pada data (seperti yang Anda tunjukkan), yang tidak standar. Secara normal kita memiliki . L:{ParameterSpace}×{Actions}R
Zen

@ Zen: Ya, tentu saja, saya salah mengartikannya. Terima kasih telah menunjukkannya. :)
MånsT

3
@ MånsT: (+1) Ini adalah jawaban yang menarik. Saya sangat menghargai kenyataan bahwa Anda memilih untuk menandai ini sebagai CW dalam contoh ini, tetapi saya berharap Anda tidak memilikinya. :-)
kardinal

8

Saya kebetulan membaca makalah arXiv Anda sebelum datang ke pertanyaan ini dan sudah menulis entri blog di atasnya ( dijadwalkan muncul pada Oktober, 08 ). Singkatnya, saya menemukan konstruksi Anda dari kepentingan teoretis, tetapi juga berpikir itu terlalu dibuat-buat untuk direkomendasikan, khususnya. karena tampaknya tidak menyelesaikan hipotesis titik-nol masalah pengujian Bayesian, yang secara tradisional mengharuskan untuk meletakkan beberapa massa sebelumnya pada nilai parameter titik-nol.

Intinya, solusi yang Anda usulkan di atas (dalam pembaruan Oktober) dan sebagai Teorema 2 dalam makalah arXiv Anda bukan prosedur pengujian yang valid karena mengambil tiga nilai, bukan dua nilai yang sesuai untuk menerima / menolak. Demikian pula, fungsi kerugian yang Anda gunakan dalam Teorema 3 (tidak direproduksi di sini) sama dengan menguji hipotesis satu sisi, , daripada hipotesis titik-nol .φH0:θθ0H0:θ=θ0

Namun masalah utama saya adalah bahwa bagi saya tampaknya baik Teorema 3 dan Teorema 4 dalam makalah arXiv Anda tidak valid ketika adalah hipotesis titik-nol, yaitu ketika , tanpa massa sebelumnya.H0Θ0={θ0}


1
Terima kasih (+1) atas komentar Anda! Saya sangat menantikan untuk membaca posting blog Anda. :) Seperti yang Anda tunjukkan, Teorema 3 dan 4 hanya berkaitan dengan hipotesis komposit. The di Teorema 2 yaitu salah cetak. Itu harus membaca , dalam hal ini ketika , yang terjadi ketika adalah dalam interval yang kredibel. Saya akan mengubahnya dalam manuskrip arXiv sesegera mungkin! α / 2 φ = 0 α / 2 < min ( P ( Θ - 1 ) , P ( Θ 1 ) ) θ 01α/2α/2φ=0α/2<min(P(Θ1),P(Θ1))θ0
MånsT

Anda benar (+1!), Saya memikirkan ketidaksetaraan dengan cara lain! Dalam dokumen arXiv, ketimpangan pusat ditulis dengan cara yang salah. yaitu orang harus menerima iffH0
Xi'an

Itu bagus untuk didengar :) Naskah yang diperbarui (dengan Thm 2 dikoreksi) akan berada di arXiv pada hari Senin. Saya akan membuat asumsi bahwa bukan titik-nol di Thm 4 juga eksplisit. Θ0
MånsT

1
Pastikan untuk mengklarifikasi bukti Teorema 2 dalam dokumen arXiv: ketidaksetaraan yang ditampilkan ditulis dengan cara yang salah. yaitu seseorang harus menerima iff , bukan sebaliknya! P ( θ Θ i | x ) > α / 2H0P(θΘi|x)>α/2
Xi'an

3

Anda dapat menggunakan interval yang kredibel (atau wilayah HPD) untuk pengujian hipotesis Bayesian. Saya pikir itu tidak umum; meskipun, untuk bersikap adil saya tidak melihat banyak juga tidak saya menggunakan pengujian Hipotesis Bayesian formal dalam praktek. Faktor Bayes kadang-kadang digunakan (dan dalam "Bayesian Core" Robert agak dipuji) dalam pengujian hipotesis yang ditetapkan.


1
Cheers @Fraijo! Bisakah Anda menjelaskan sedikit tentang bagaimana jawaban Anda berbeda dari jawaban Michael Chernick?
MånsT

2
Saya tidak berpikir penggunaan faktor Bayes untuk menguji hipotesis adalah "sesekali", lihat misalnya referensi ini .

@ MånsT dalam tindak lanjutnya, proses yang Michael jelaskan tampaknya merupakan uji Faktor Bayes. Pada dasarnya Anda membuat dua model dengan prior yang berbeda berdasarkan pada hipotesis Anda dan kemudian membandingkan probabilitas set data berdasarkan pada prior tersebut. Referensi yang diposting oleh Procrasinator memberikan ulasan singkat tentang ini.
Fraijo

1
@Prastrastator Saya sesekali mengatakan hanya karena di industri saya, saya melihat beberapa orang menggunakan metode Bayesian, apalagi menggunakan metode Bayesian untuk menguji hipotesis. Secara pribadi saya menggunakan faktor Bayes untuk memeriksa model saya untuk sensitivitas terhadap sebelumnya, yang saya kira adalah bentuk pengujian hipotesis.
Fraijo

1
@ MånsT jawaban singkat: tidak. Menyiapkan interval yang kredibel dan mencari tahu apakah itu berisi hipotesis nol adalah satu-satunya tes langsung yang sebanding dengan pengujian hipotesis frequentist. Ada dua masalah dengan metode ini: 1) fakta yang jelas bahwa Anda dapat menemukan banyak wilayah dalam beberapa kasus (misalnya HPD versus wilayah simetris) dan 2) menguji hipotesis titik (theta = a) bertentangan dengan parameter Bayesian ideal parameter mengambil distribusi (theta ~ P (theta)).
Fraijo

1

Wilayah yang kredibel hanyalah wilayah di mana integral dari kepadatan posterior di atas wilayah adalah probabilitas yang ditentukan misalnya 0,95. Salah satu cara untuk membentuk uji hipotesis Bayesian adalah untuk melihat apakah nilai nol yang dihipotesiskan dari parameter jatuh di wilayah yang kredibel. Dengan cara ini kita dapat memiliki korespondensi 1-1 yang serupa antara tes hipotesis dan daerah yang kredibel seperti yang sering dilakukan dengan interval kepercayaan dan tes hipotesis. Tetapi ini bukan satu-satunya cara untuk melakukan pengujian hipotesis.


Apakah tes Bayesian ad hoc semacam ini sering digunakan dalam praktik?
MånsT

1
@ MansT saya tidak berpikir begitu. Saya berpikir bahwa biasanya orang Bayesian menempatkan peluang sebelumnya pada hipotesis nol menjadi benar dan kemudian berdasarkan pada data yang membangun peluang posterior. Jika peluang posterior adalah storngly terhadap hipotesis nol maka ditolak. Saya bukan orang terbaik untuk bertanya karena saya tidak sering melakukan inferensi Bayesian.
Michael R. Chernick

2
Tes yang dijelaskan oleh Michael dikreditkan ke Lindley oleh Zellner dalam bukunya tentang ekonometrika Bayesian.
Zen

1
Ya, tes semacam ini tentu saja muncul dari ide Bayesian , tetapi saya tidak yakin apakah mereka memiliki dasar yang kuat dalam teori keputusan Bayesian . Dalam pengaturan terakhir saya akan mengharapkan tes berasal dari fungsi yang hilang, biasanya melibatkan fungsi tes.
MånsT


-1

Biarkan saya berikan bagaimana saya mendapatkannya membaca jawaban Tim .

Ini didasarkan pada tampilan tabel dengan hipotesis (estimasi parameter) dalam kolom dan pengamatan di baris.

masukkan deskripsi gambar di sini

Dalam tabel pertama, Anda memiliki jumlah probabilitas kol menjadi 1, yaitu probabilitas probabilitas bersyarat, yang kondisinya, masuk ke acara kolom disediakan di baris bawah, yang disebut 'prior'. Dalam tabel terakhir, jumlah baris yang sama dengan 1 dan di tengah Anda memiliki probabilitas gabungan, yaitu probabilitas bersyarat yang Anda temukan di tabel pertama dan terakhir dikalikan probabilitas kondisi, priors.

Tabel pada dasarnya melakukan transformasi Bayesian: pada tabel pertama, Anda memberikan pdf dari pengamatan (baris) di setiap kolom, tetapkan sebelum untuk hipotesis ini (ya, kolom hipotesis adalah pdf dari pengamatan di bawah hipotesis itu), Anda melakukan itu karena setiap kolom dan tabel membawanya pertama kali ke dalam tabel probabilitas gabungan dan, kemudian ke probabilitas hipotesis Anda, dikondisikan oleh pengamatan.

Seperti yang saya dapatkan dari jawaban Tim (koreksi saya jika saya salah), pendekatan Interval Kritis terlihat pada tabel pertama. Yaitu, setelah percobaan selesai, kita tahu deretan tabel (baik kepala atau ekor dalam contoh saya tetapi Anda dapat membuat percobaan yang lebih kompleks, seperti 100 koin membalik dan mendapatkan meja dengan 2 ^ 100 baris). Pemindaian frekuensi melalui kolom-kolomnya, yang, seperti telah saya katakan, adalah distribusi hasil yang mungkin dalam kondisi bahwa hipotesis masuk akal (misalnya koin adil dalam contoh saya), dan menolak hipotesis (kolom) yang telah memberikan nilai probabilitas sangat rendah pada baris yang diamati.

Bayesianist pertama-tama menyesuaikan probabilitas, mengubah col menjadi baris dan melihat tabel 3, menemukan deretan hasil yang diamati. Karena ini juga pdf, ia melewati baris hasil eksperimen dan memilih hipotesis probabilitas tertinggi hingga 95% kantong kredibilitasnya penuh. Sisa hipotesis ditolak.

Apa anda suka? Saya masih dalam proses belajar dan grafik sepertinya membantu saya. Saya percaya bahwa saya berada di jalur yang benar karena pengguna yang memiliki reputasi memberikan gambar yang sama, ketika menganalisis perbedaan dua pendekatan . Saya telah mengajukan pandangan grafis tentang mekanisme pemilihan hipotesis.

Saya mendorong semua orang untuk membaca jawaban terakhir Keith, tetapi gambaran saya tentang mekanika uji hipotesis dapat langsung mengatakan bahwa frequentist tidak melihat hipotesis lain ketika memverifikasi hipotesis saat ini sedangkan pertimbangan hipotesis kredibilitas tinggi sangat berdampak pada penerimaan / penolakan hipotesis lain di bayesian. analisys karena jika Anda memiliki hipotesis tunggal yang terjadi 95% dari waktu di bawah data yang diamati, Anda segera membuang semua hipotesis lainnya, terlepas dari seberapa baik data tersebut sesuai di dalamnya. Mari kita letakkan analisis kekuatan statistik, yang membedakan dua hipotesis berdasarkan interval kepercayaannya tumpang tindih.

Tapi, saya tampaknya telah menemukan kesamaan antara dua pendekatan: mereka tampaknya terhubung melalui P(A | B) > P(A) <=> P(B|A) > P(B)properti . Pada dasarnya, jika ada ketergantungan antara A dan B maka itu akan muncul sebagai korelasi di kedua tabel freq dan bayesian. Jadi, melakukan satu uji hipotesis berkorelasi dengan yang lain, mereka agak harus memberikan hasil yang sama. Mempelajari akar korelasinya, kemungkinan akan memberi Anda koneksi di antara keduanya. Dalam pertanyaan saya di sana saya sebenarnya bertanya mengapa perbedaan itu bukan korelasi absolut?

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.