Setiap probabilitas posterior valid dalam kasus ini
Ini adalah pertanyaan yang menarik, yang masuk ke wilayah fondasi probabilitas. Ada beberapa pendekatan yang mungkin di sini, tetapi untuk alasan yang akan saya uraikan segera, pendekatan yang saya sukai adalah untuk memberikan definisi yang lebih luas tentang probabilitas kondisional yang analog dengan definisi ketika berurusan dengan variabel acak kontinu. (Perincian metode ini ditunjukkan di bawah ini.) Dalam kasus khusus ini, ini mengarah pada kesimpulan bahwa Bayesian dapat memiliki keyakinan posterior tentang , dan ini menghasilkan seperangkat keyakinan yang koheren (meskipun mereka telah mengamati suatu peristiwa yang mereka yakini memiliki probabilitas nol).X
Keuntungan dari pendekatan ini adalah memberikan distribusi posterior yang terdefinisi dengan baik, dan memungkinkan Bayesian untuk memperbarui keyakinan mereka tergantung pada pengamatan suatu peristiwa yang ditetapkan terjadi dengan probabilitas nol. Posterior pada dasarnya diperbarui secara sewenang-wenang (setiap probabilitas posterior sama-sama koheren), tetapi fleksibilitas itu tidak mengejutkan mengingat apa yang telah terjadi. Dalam hal ini, orang Bayesia yang berbeda dengan kepercayaan sebelumnya yang sama dapat secara sah sampai pada kesimpulan posterior yang berbeda, karena fakta bahwa mereka semua telah mengamati suatu peristiwa dengan probabilitas nol apriori .
Probabilitas bersyarat untuk variabel acak kontinu: Ketika kita berurusan dengan variabel acak kontinu, fungsi probabilitas bersyarat didefinisikan melalui turunan Radon-Nikodym , dan pada dasarnya hanya membutuhkan fungsi untuk memenuhi hukum probabilitas gabungan. Jika dan adalah variabel acak kontinu (bukan peristiwa diskrit) dalam ruang probabilitas maka kita akan mendefinisikan fungsi probabilitas bersyarat sebagai setiap pengukuran non-negatif yang dapat diukur. fungsi yang memenuhi persamaan integral:XE(Ω,G,P)p(x|e)
p(x)=∫Ep(x|e) dP(e)for all x∈X∈G.
Karena juga didefinisikan melalui turunan Radon-Nikodym, ini secara implisit berarti bahwa dapat berupa fungsi terukur non-negatif yang memenuhi persamaan integral:p(x)p(x|e)
P(X∈A)=∫A∫Ep(x|e) dP(e) dxfor all A∈G.
Ini memberikan solusi non-unik untuk fungsi probabilitas bersyarat, meskipun dalam praktiknya, setiap solusi "hampir pasti" setara (yaitu, mereka berbeda hanya pada serangkaian hasil dengan probabilitas nol) sehingga tidak ada masalah dengan non-keunikan. .
Menentukan probabilitas kondisional untuk kejadian diskrit: Definisi standar untuk probabilitas kondisional untuk kejadian diskrit adalah rumus rasio yang terkenal, di mana penyebutnya adalah probabilitas kejadian pengkondisian. Jelas, dalam kasus di mana peristiwa pengkondisian memiliki probabilitas nol, objek ini tidak terdefinisi. Solusi yang jelas di sini adalah memperluas definisi dengan cara yang analog dengan metode yang digunakan dalam kasus kontinu. Yaitu, kita mendefinisikan pasangan probabilitas bersyarat dan sebagai pasangan nilai antara nol dan satu yang memenuhi persamaan:P(X|E)P(X|E¯)
P(X)=P(X|E)×P(E)+P(X|E¯)×(1−P(E)).
Dalam kasus yang ditentukan dalam pertanyaan, kami memiliki keyakinan sebelumnya dan distribusi sampling , yang mengarah ke . Mengganti nilai-nilai ini ke dalam persamaan di atas memberi:P(X)=1P(E|X)=0P(E)=0
1=P(X|E)×0+P(X|E¯)×1.
Kita dapat melihat bahwa persamaan ini puas dengan mengambil dan . Dengan demikian, probabilitas bersyarat (posterior) dapat secara koheren merupakan nilai antara nol dan satu. Ketika kami mengatakan bahwa ini adalah "koheren", kami hanya berarti bahwa probabilitas posterior tidak konsisten dengan probabilitas lain yang ditetapkan dalam masalah (yaitu, probabilitas sebelum dan pengambilan sampel).P(X|E¯)=10⩽P(X|E)⩽1P(X|E)
Mengapa pendekatan ini paling masuk akal: Sangat mungkin bahwa analisis Bayesian dapat melibatkan pengamatan peristiwa diskrit yang memiliki probabilitas nol yang ditetapkan dalam distribusi sebelumnya. Sebagai contoh, dalam model standar pembalikan koin, kami menetapkan distribusi Bernoulli untuk hasil kepala / ekor, tetapi ada kemungkinan bahwa koin dapat bertumpu pada ujungnya (sehingga tidak menjadi kepala atau ekor). Otak tidak boleh meledak dalam kasus ini, dan karena itu berkenaan dengan alasan Bayesian untuk memiliki cara yang jelas untuk melanjutkan dalam kasus ini.
Keuntungan utama dari pendekatan yang saya uraikan adalah selalu mengarah pada setidaknya satu nilai yang diijinkan untuk probabilitas posterior (yaitu, probabilitas posterior didefinisikan dengan baik ). Probabilitas posterior tidak didefinisikan secara unik, tetapi itu adalah cabang alami dari fakta bahwa ada beberapa nilai yang sama-sama koheren dengan pengamatan sampling probabilitas nol. Pendekatan ini berarti bahwa Bayesian bebas untuk menentukan probabilitas posterior, dan ini sama koheren dengan yang lain. (Ingatlah bahwa ketika kita mengatakan "koheren" di sini, kita berbicara tentang koherensi dengan keyakinan sebelumnya yang menetapkan probabilitas nol untuk peristiwa diskrit yang benar-benar terjadi, sehingga koherensi dengan itu bukan bar yang tinggi!)
Ada manfaat besar lain untuk pendekatan ini , yaitu memungkinkan Bayesian untuk memperbarui keyakinannya dalam menanggapi mengamati suatu peristiwa yang memiliki kemungkinan pengambilan sampel nol di bawah sebelumnya, dan khususnya, Bayesian sekarang dapat merevisi keyakinannya. sehingga mereka tidak lagi menganggap nol probabilitas untuk acara ini . Dalam contoh yang Anda berikan, Bayesian sebelumnya memiliki keyakinan bahwa benar hampir pasti, beli kemudian amati suatu peristiwa dengan probabilitas sampling nol yang tergantung pada peristiwa ini. Sekarang Bayesian bebas untuk memperbarui keyakinannya ke probabilitas posterior untuk yang tidak satu (dan probabilitas posterior yang sesuai untukXX X¯itu bukan nol). Jadi, pada intinya, orang Bayesian sekarang dapat mengatakan, "Oh, sial! Itu tadi konyol! Biarkan saya memperbarui kepercayaan saya pada peristiwa itu sehingga tidak lagi terjadi hampir pasti! Selain itu, ini bukan perubahan ad hoc , tetapi pembaruan "koheren" yang sah dilakukan di bawah teorema Bayes.