rupanya faktor Bayes entah bagaimana menggunakan kemungkinan yang mewakili kemungkinan masing-masing model terintegrasi pada seluruh ruang parameternya (yaitu tidak hanya di MLE). Bagaimana sebenarnya integrasi ini dicapai secara khas? Apakah seseorang benar-benar hanya mencoba menghitung kemungkinan pada setiap ribuan (jutaan?) Sampel acak dari ruang parameter, atau adakah metode analitik untuk mengintegrasikan kemungkinan di seluruh ruang parameter?
P(D|M)DM
Penting untuk menempatkan faktor Bayes dalam pengaturan yang tepat. Ketika Anda memiliki dua model, katakanlah, dan Anda mengonversi dari probabilitas ke peluang, maka faktor Bayes bertindak seperti operator berdasarkan keyakinan sebelumnya:
PosteriorOdds=BayesFactor∗PriorOdds
P(M1|D)P(M2|D)=B.F.×P(M1)P(M2)
Perbedaan nyata adalah bahwa rasio kemungkinan lebih murah untuk dihitung dan secara umum lebih mudah untuk ditentukan secara konseptual. Kemungkinan pada MLE hanyalah perkiraan titik dari faktor pembilang dan penyebut faktor Bayes. Seperti konstruksi yang paling sering, itu dapat dilihat sebagai kasus khusus dari analisis Bayesian sebelum dibuat yang sulit untuk dicapai. Tetapi sebagian besar muncul karena secara analitik dapat ditelusuri dan lebih mudah untuk dihitung (di era sebelum perkiraan pendekatan komputasi Bayesian muncul).
Untuk titik pada perhitungan, ya: Anda akan mengevaluasi integral kemungkinan berbeda dalam pengaturan Bayesian dengan prosedur Monte Carlo skala besar di hampir semua kasus kepentingan praktis. Ada beberapa simulator khusus, seperti GHK, yang berfungsi jika Anda mengasumsikan distribusi tertentu, dan jika Anda membuat asumsi-asumsi ini, kadang-kadang Anda dapat menemukan masalah yang dapat ditelusuri secara analitik di mana terdapat faktor Bayes yang sepenuhnya analitik.
Tapi tidak ada yang menggunakan ini; tidak ada alasan untuk itu. Dengan sampler Metropolis / Gibbs yang dioptimalkan dan metode MCMC lainnya, sangat praktis untuk mendekati masalah ini dengan cara yang sepenuhnya didorong data dan menghitung integral Anda secara numerik. Bahkan, seseorang akan sering melakukan ini secara hierarkis dan lebih lanjut mengintegrasikan hasil lebih dari meta-prior yang berhubungan dengan mekanisme pengumpulan data, desain eksperimental yang tidak dapat diabaikan, dll.
Saya merekomendasikan buku Analisis Data Bayesian untuk informasi lebih lanjut tentang ini. Meskipun, penulis, Andrew Gelman, tampaknya tidak terlalu peduli dengan faktor Bayes . Selain itu, saya setuju dengan Gelman. Jika Anda akan pergi Bayesian, maka memanfaatkan posterior penuh. Melakukan pemilihan model dengan metode Bayesian seperti menghambat mereka, karena pemilihan model adalah bentuk inferensi yang lemah dan sebagian besar tidak berguna. Saya lebih suka mengetahui distribusi daripada pilihan model jika saya bisa ... siapa yang peduli tentang menghitungnya menjadi "model A lebih baik daripada model B" ketika Anda tidak perlu?
Selain itu, ketika menghitung faktor Bayes, apakah seseorang menerapkan koreksi untuk kompleksitas (secara otomatis melalui estimasi kemungkinan yang divalidasi silang atau secara analitis melalui AIC) seperti halnya dengan rasio kemungkinan?
M1M2d1d2d1<d2N
B1,2M1M1N→∞B1,2∞
B1,2=O(N12(d2−d1))
Saya akrab dengan derivasi ini dan diskusi dari buku Finite Mixture dan Markov Switching Models oleh Sylvia Frühwirth-Schnatter, tetapi ada kemungkinan lebih banyak akun statistik langsung yang masuk lebih dalam ke dalam epistemologi yang mendasarinya.
Saya tidak tahu detailnya cukup baik untuk diberikan di sini, tapi saya percaya ada beberapa hubungan teoritis yang cukup mendalam antara ini dan derivasi AIC. Buku Teori Informasi oleh Cover dan Thomas mengisyaratkan setidaknya ini.
Juga, apa perbedaan filosofis antara rasio kemungkinan dan faktor Bayes (nb saya tidak bertanya tentang perbedaan filosofis antara rasio kemungkinan dan metode Bayesian secara umum, tetapi faktor Bayes sebagai representasi dari bukti objektif khususnya). Bagaimana cara mengkarakterisasi makna faktor Bayes dibandingkan dengan rasio kemungkinan?
Bagian artikel Wikipedia tentang "Interpretasi" melakukan pekerjaan yang baik untuk membahas hal ini (terutama bagan yang menunjukkan kekuatan skala bukti Jeffreys).
Seperti biasa, tidak ada banyak hal filosofis di luar perbedaan mendasar antara metode Bayesian dan metode sering (yang Anda sudah terbiasa dengan).
Hal utama adalah bahwa rasio kemungkinan tidak masuk akal dalam pengertian buku Belanda. Anda dapat membuat skenario di mana inferensi pemilihan model dari rasio kemungkinan akan menyebabkan orang menerima taruhan yang hilang. Metode Bayesian adalah koheren, tetapi beroperasi pada prior yang bisa sangat miskin dan harus dipilih secara subyektif. Pengorbanan .. pengorbanan ...
FWIW, saya pikir pemilihan model yang sangat parameterisasi ini tidak terlalu baik. Saya lebih suka metode Bayesian dan saya lebih suka mengaturnya secara lebih hierarkis, dan saya ingin kesimpulannya berpusat pada distribusi posterior penuh jika memungkinkan secara komputasi untuk melakukannya. Saya pikir faktor Bayes memiliki beberapa sifat matematika yang rapi, tetapi sebagai seorang Bayesian sendiri, saya tidak terkesan oleh mereka. Mereka menyembunyikan bagian yang sangat berguna dari analisis Bayesian, yaitu bahwa hal itu memaksa Anda untuk berurusan dengan para prior Anda di tempat terbuka alih-alih menyapu mereka di bawah permadani, dan memungkinkan Anda untuk melakukan inferensi pada tampilan penuh.