Sampling dari posterior yang tidak benar (density) tidak masuk akal dari probabilistik / sudut pandang teoritis. Alasan untuk ini adalah bahwa fungsi f tidak memiliki integral hingga pada ruang parameter dan, akibatnya, tidak dapat dihubungkan dengan model probabilitas ( ukuran terbatas) ( Ω , σ , P ) (spasi, aljabar-aljabar, ukuran probabilitas ).ff( Ω , σ, P )
Jika Anda memiliki model dengan prior yang tidak tepat yang mengarah ke posterior yang tidak tepat, dalam banyak kasus Anda masih dapat mengambil sampel darinya menggunakan MCMC, misalnya Metropolis-Hastings, dan "sampel posterior" mungkin terlihat masuk akal. Ini terlihat menarik dan paradoks pada pandangan pertama. Namun, alasan untuk ini adalah bahwa metode MCMC terbatas pada keterbatasan numerik komputer dalam praktiknya, dan oleh karena itu, semua dukungan dibatasi (dan diskrit!) Untuk komputer. Kemudian, di bawah batasan-batasan itu (batas dan kelonggaran) posterior sebenarnya tepat dalam banyak kasus.
Ada referensi hebat oleh Hobert dan Casella yang menyajikan contoh (dari sifat yang sedikit berbeda) di mana Anda dapat membuat sampler Gibbs untuk posterior, sampel posterior terlihat sangat masuk akal, tetapi posterior tidak tepat!
http://www.jstor.org/stable/2291572
Contoh serupa baru-baru ini muncul di sini . Bahkan, Hobert dan Casella memperingatkan pembaca bahwa metode MCMC tidak dapat digunakan untuk mendeteksi ketidakwajaran posterior dan bahwa ini harus diperiksa secara terpisah sebelum menerapkan metode MCMC. Singkatnya:
- Beberapa sampler MCMC, seperti Metropolis-Hastings, dapat (tetapi tidak seharusnya) digunakan untuk mengambil sampel dari posterior yang tidak tepat karena komputer membatasi dan mencacah ruang parameter. Hanya jika Anda memiliki sampel besar , Anda mungkin dapat mengamati beberapa hal aneh. Seberapa baik Anda dapat mendeteksi masalah ini juga tergantung pada distribusi "instrumental" yang digunakan dalam sampler Anda. Poin terakhir membutuhkan diskusi yang lebih luas, jadi saya lebih suka meninggalkannya di sini.
- (Hobert dan Casella). Fakta bahwa Anda dapat membuat sampler Gibbs (model kondisional) untuk model dengan prior yang tidak patut tidak menyiratkan bahwa posterior (model gabungan) tepat.
- Interpretasi probabilistik formal dari sampel posterior membutuhkan kepatutan posterior. Hasil dan bukti konvergensi ditetapkan hanya untuk distribusi / pengukuran probabilitas yang tepat.
PS (sedikit lidah di pipi): Jangan selalu percaya apa yang orang lakukan dalam Pembelajaran Mesin. Seperti yang dikatakan Prof. Brian Ripley: "pembelajaran mesin adalah statistik dikurangi pengecekan model dan asumsi".