Saya akan merekomendasikan menggunakan "Distribusi beta dari jenis kedua" ( singkatnya Beta 2 ) untuk distribusi yang agak informatif , dan untuk menggunakan distribusi gamma inversi konjugat jika Anda memiliki keyakinan kuat sebelumnya. Alasan saya mengatakan ini adalah bahwa konjugat prior tidak kuat dalam arti bahwa, jika sebelum dan data konflik, prior memiliki pengaruh tidak terbatas pada distribusi posterior. Perilaku semacam itu adalah apa yang saya sebut "dogmatis", dan tidak dibenarkan oleh informasi sebelumnya yang ringan .
Properti yang menentukan ketahanan adalah perilaku ekor dari kemungkinan sebelumnya dan kemungkinan. Artikel yang sangat bagus menguraikan rincian teknis di sini . Misalnya, kemungkinan dapat dipilih (mengatakan t-distribusi) seperti itu sebagai sebuah pengamatan (yaitu menjadi sewenang-wenang besar) itu dibuang dari analisis parameter lokasi (banyak cara yang sama bahwa Anda akan intuitif lakukan dengan pengamatan seperti itu). Tingkat "membuang" tergantung pada seberapa berat ekor distribusi.yi→∞
Beberapa slide yang menunjukkan aplikasi dalam konteks pemodelan hierarkis dapat ditemukan di sini (menunjukkan bentuk matematika dari distribusi Beta 2 ), dengan makalah di sini .
Jika Anda tidak berada dalam konteks pemodelan hierarkis, maka saya akan menyarankan membandingkan posterior (atau hasil apa pun yang Anda buat) tetapi gunakan Jeffrey sebelum parameter skala, yang diberikan oleh . Ini dapat dibuat sebagai bataskepadatanBeta2karena kedua parameternya menyatu menjadi nol. Untuk perkiraan Anda bisa menggunakan nilai kecil. Tetapi saya akan mencoba untuk menyelesaikan solusi secaraanalitisjika memungkinkan (dan jika bukan solusi analitik yang lengkap, dapatkan solusi analitis sejauh mungkin), karena Anda tidak hanya akan menghemat waktu komputasi, tetapi Anda juga juga cenderungmemahamiapa yang terjadi dalam model Anda dengan lebih baik.p(σ)∝1σ
Alternatif selanjutnya adalah menentukan informasi Anda sebelumnya dalam bentuk kendala (rata-rata sama dengan , varians sama dengan V , IQR sama dengan I Q R , dll. Dengan nilai M , V , I Q R yang ditentukan sendiri), dan kemudian gunakan distribusi entropi maksimum (cari karya apa pun oleh Edwin Jaynes atau Larry Bretthorst untuk penjelasan yang baik tentang apa Entropi Maksimum itu dan apa yang bukan) sehubungan dengan "ukuran invarian" Jeffreys ' m ( σ ) = 1MVIQRM,V,IQR . m(σ)=1σ
MaxEnt adalah versi "Rolls Royce", sedangkan Beta 2 lebih merupakan versi "sedan". Alasan untuk ini adalah bahwa distribusi MaxEnt "mengasumsikan paling sedikit" tunduk pada kendala yang Anda masukkan ke dalamnya (misalnya, tidak ada kendala berarti Anda baru saja mendapatkan Jeffrey sebelumnya), sedangkan distribusi Beta 2 mungkin berisi beberapa fitur "tersembunyi" yang mungkin atau mungkin tidak diinginkan dalam kasus khusus Anda (misalnya, jika informasi sebelumnya lebih dapat diandalkan daripada data, maka Beta 2 buruk).
Properti bagus lain dari distribusi MAXENT adalah bahwa jika tidak ada kendala yang tidak ditentukan beroperasi dalam mekanisme pembangkit Data maka distribusi MAXENT adalah sangat paling mungkin distribusi yang Anda akan melihat (kita berbicara peluang cara di atas miliaran dan triliunan untuk satu). Oleh karena itu, jika distribusi yang Anda lihat bukan yang MaxEnt, maka ada kemungkinan kendala tambahan yang Anda belum tentukan beroperasi pada proses yang sebenarnya, dan nilai-nilai yang diamati dapat memberikan petunjuk tentang apa yang mungkin menjadi kendala itu.