Suntingan: Saya telah menambahkan contoh sederhana: inferensi rata-rata . Saya juga sedikit mengklarifikasi mengapa interval kredibel tidak cocok dengan interval kepercayaan buruk.
Saya, seorang Bayesian yang cukup taat, berada di tengah krisis kepercayaan.
Masalah saya adalah sebagai berikut. Asumsikan bahwa saya ingin menganalisis beberapa data IID . Apa yang akan saya lakukan adalah:
pertama, usulkan model kondisional:
Kemudian, pilih sebelum pada :
Akhirnya, terapkan aturan Bayes, hitung posterior: (atau beberapa perkiraan untuk itu jika tidak dapat dihitung) dan jawab semua pertanyaan yang saya miliki tentang
Ini adalah pendekatan yang masuk akal: jika model sebenarnya dari data memang "di dalam" dari kondisi saya (itu sesuai dengan beberapa nilai ), maka saya dapat meminta teori keputusan statistik untuk mengatakan bahwa metode saya dapat diterima (lihat Robert's "Pilihan Bayesian" untuk detail; "Semua statistik" juga memberikan akun yang jelas dalam bab yang relevan).
Namun, seperti yang diketahui semua orang, dengan menganggap bahwa model saya benar adalah cukup sombong: mengapa alam harus dimasukkan dengan rapi ke dalam kotak model yang telah saya pertimbangkan? Jauh lebih realistis untuk mengasumsikan bahwa model nyata dari data berbeda dari untuk semua nilai . Ini biasanya disebut model "salah spesifikasi".
Masalah saya adalah, dalam hal kesalahan spesifikasi yang lebih realistis ini, saya tidak memiliki argumen yang bagus untuk menjadi Bayesian (yaitu: menghitung distribusi posterior) dibandingkan dengan hanya menghitung Pengukur Kemungkinan Maksimum (MLE):
Memang, menurut Kleijn, vd Vaart (2012) , dalam kasus yang tidak ditentukan, distribusi posterior:
konvergen sebagai ke distribusi dirac yang berpusat pada
tidak memiliki varians yang benar (kecuali dua nilai kebetulan sama) untuk memastikan bahwa interval kredibilitas kecocokan posterior kecocokan untuk dapat dipercaya . (Perhatikan bahwa, meskipun interval kepercayaan jelas merupakan sesuatu yang orang Bayesia tidak pedulikan secara berlebihan, ini secara kualitatif berarti bahwa distribusi posterior secara intrinsik salah, karena ini menyiratkan bahwa interval kredibelnya tidak memiliki cakupan yang benar)
Dengan demikian, kami membayar premi komputasi (inferensi Bayesian, secara umum, lebih mahal daripada MLE) tanpa properti tambahan
Jadi, akhirnya, pertanyaan saya : apakah ada argumen, apakah teoretis atau empiris, untuk menggunakan inferensi Bayesian atas alternatif MLE yang lebih sederhana ketika model tersebut tidak ditentukan dengan spesifik?
(Karena saya tahu bahwa pertanyaan saya sering tidak jelas, harap beri tahu saya jika Anda tidak memahami sesuatu: Saya akan mencoba untuk mengulanginya)
Sunting: mari kita pertimbangkan contoh sederhana: menyimpulkan rata-rata bawah model Gaussian (dengan varians yang dikenal untuk menyederhanakan lebih jauh). Kami menganggap Gaussian prior: kami menunjukkan mean sebelumnya, varian terbalik dari prior. Biarkan menjadi rata-rata empiris dari . Akhirnya, perhatikan: .
Distribusi posterior adalah:
Dalam kasus yang ditentukan dengan benar (ketika benar-benar memiliki distribusi Gaussian), posterior ini memiliki properti bagus berikut
Jika dihasilkan dari model hierarkis di mana rata-rata bersama mereka diambil dari distribusi sebelumnya, maka interval kredibel posterior memiliki cakupan yang tepat. Bersyarat pada data, probabilitas berada dalam interval apa pun sama dengan probabilitas bahwa posterior menganggap interval ini.
Bahkan jika prior tidak benar, interval kredibel memiliki cakupan yang benar dalam batas di mana pengaruh sebelumnya pada posterior menghilang
posterior selanjutnya memiliki sifat-sifat frequentist yang baik: setiap estimator Bayesian yang dibangun dari posterior dijamin dapat diterima, mean posterior adalah estimator yang efisien (dalam pengertian Cramer-Rao) dari interval mean, kredibel, asimtotik, interval kepercayaan.
Dalam kasus yang tidak ditentukan secara spesifik, sebagian besar properti ini tidak dijamin oleh teori. Untuk memperbaiki ide, mari kita asumsikan bahwa model nyata untuk adalah bahwa mereka bukan distribusi siswa. Satu-satunya properti yang dapat kami jamin (Kleijn et al) adalah bahwa distribusi posterior berkonsentrasi pada rata-rata yang dalam batas . Secara umum, semua properti cakupan akan hilang. Lebih buruk lagi, secara umum, kami dapat menjamin bahwa, dalam batas itu, properti cakupan pada dasarnya salah: distribusi posterior menganggap probabilitas yang salah untuk berbagai wilayah ruang.