Banyak orang (di luar pakar spesialis) yang berpikir bahwa mereka sering mengunjungi mereka sebenarnya adalah Bayesian. Ini membuat perdebatan sedikit tidak ada gunanya. Saya pikir Bayesianisme menang, tetapi masih ada banyak orang Bayesian yang berpikir bahwa mereka adalah orang-orang yang sering. Ada beberapa orang yang berpikir bahwa mereka tidak menggunakan prior dan karenanya mereka pikir mereka sering. Ini logika yang berbahaya. Ini tidak begitu banyak tentang prior (prior uniform atau non-uniform), perbedaan nyata lebih halus.
(Saya tidak secara resmi di departemen statistik; latar belakang saya adalah matematika dan ilmu komputer. Saya menulis karena kesulitan yang saya miliki untuk mencoba membahas 'debat' ini dengan non-ahli statistik lainnya, dan bahkan dengan beberapa karir awal ahli statistik.)
MLE sebenarnya adalah metode Bayesian. Beberapa orang akan mengatakan "Saya seorang yang sering karena saya menggunakan MLE untuk memperkirakan parameter saya". Saya telah melihat ini dalam literatur peer-review. Ini omong kosong dan didasarkan pada mitos ini (tidak terungkap, tetapi tersirat) bahwa frequentist adalah seseorang yang menggunakan seragam sebelum bukannya sebelumnya tidak seragam.
μ=0θ
X≡N(μ=0,σ2=θ)
xθθx
f(x,θ)=Pσ2=θ(X=x)=12πθ√e−x22θ
xθ
θθx
Perbedaan antara irisan horizontal dan vertikal sangat penting, dan saya menemukan analogi ini membantu saya untuk memahami pendekatan bias yang sering dilakukan .
Sebuah Bayesian adalah seseorang yang mengatakan
θf(x,θ)
g(θ)
θf(x,θ)g(θ)
Jadi Bayesian memperbaiki x dan melihat irisan vertikal yang sesuai dalam plot kontur tersebut (atau dalam plot varian yang menyertakan sebelumnya). Dalam irisan ini, area di bawah kurva tidak harus 1 (seperti yang saya katakan sebelumnya). Interval kredibel Bayesian 95% (CI) adalah interval yang mengandung 95% area yang tersedia. Misalnya, jika area tersebut 2, maka area di bawah Bayesian CI harus 1,9.
θ
θ
N(μ=0,σ2=θ)θx−3θ√+3θ√
θ
Ini bukan satu-satunya cara untuk membangun CI yang sering, bahkan bukan yang bagus (sempit), tetapi tahan sebentar saja.
Cara terbaik untuk menafsirkan kata 'interval' bukan sebagai interval pada baris 1-d, tetapi untuk menganggapnya sebagai area pada bidang 2-d di atas. 'Interval' adalah bagian dari bidang 2-d, bukan garis 1-d. Jika seseorang mengusulkan 'interval' seperti itu, maka kita harus menguji apakah 'interval' itu valid pada tingkat kepercayaan / kredibilitas 95%.
Seorang frequentist akan memeriksa validitas 'interval' ini dengan mempertimbangkan setiap irisan horizontal pada gilirannya dan melihat area di bawah kurva. Seperti yang saya katakan sebelumnya, area di bawah kurva ini akan selalu menjadi satu. Persyaratan penting adalah bahwa area dalam 'interval' setidaknya 0,95.
Bayesian akan memeriksa validitas dengan melihat potongan vertikal. Sekali lagi, area di bawah kurva akan dibandingkan dengan subarea yang berada di bawah interval. Jika yang terakhir setidaknya 95% dari yang pertama, maka 'interval' adalah interval kredibel Bayesian 95% yang valid.
Sekarang kita tahu bagaimana menguji apakah interval tertentu 'valid', pertanyaannya adalah bagaimana kita memilih opsi terbaik di antara opsi yang valid. Ini bisa menjadi seni hitam, tetapi umumnya Anda menginginkan interval tersempit. Kedua pendekatan cenderung setuju di sini - irisan vertikal dipertimbangkan dan tujuannya adalah untuk membuat interval sesempit mungkin dalam setiap irisan vertikal.
Saya belum mencoba untuk menentukan interval kepercayaan frequentist yang sesempit mungkin dalam contoh di atas. Lihat komentar oleh @ cardinal di bawah ini untuk contoh interval yang lebih sempit. Tujuan saya bukan untuk menemukan interval terbaik, tetapi untuk menekankan perbedaan antara irisan horizontal dan vertikal dalam menentukan validitas. Interval yang memenuhi persyaratan interval kepercayaan 95% sering tidak akan memenuhi persyaratan interval kredibel Bayesian 95%, dan sebaliknya.
Kedua pendekatan menginginkan interval yang sempit, yaitu ketika mempertimbangkan satu irisan vertikal kami ingin membuat interval (1-d) dalam irisan itu menjadi sesempit mungkin. Perbedaannya adalah dalam bagaimana 95% ditegakkan - seorang frequentist hanya akan melihat interval yang diusulkan di mana 95% dari setiap daerah irisan horizontal berada di bawah interval, sedangkan Bayesian akan bersikeras bahwa setiap irisan vertikal sedemikian rupa sehingga 95% dari luasnya adalah di bawah interval.
Banyak non-ahli statistik tidak memahami ini dan mereka hanya fokus pada irisan vertikal; ini membuat mereka orang Bayesia bahkan jika mereka berpikir sebaliknya.