Kapan metode Bayesian lebih disukai daripada Frequentist?


18

Saya benar-benar ingin belajar tentang teknik Bayesian, jadi saya telah berusaha sedikit belajar sendiri. Namun, saya mengalami kesulitan melihat ketika menggunakan teknik Bayesian yang pernah memberi keuntungan atas metode Frequentist. Sebagai contoh: Saya telah melihat dalam literatur sedikit tentang bagaimana beberapa menggunakan prior informatif sedangkan yang lain menggunakan non-informatif sebelumnya. Tetapi jika Anda menggunakan prior non-informatif (yang tampaknya sangat umum?) Dan Anda menemukan bahwa distribusi posterior adalah, katakanlah, distribusi beta ... tidak bisakah Anda hanya pas dengan distribusi beta di awal dan dipanggil itu bagus? Saya tidak melihat bagaimana membangun distribusi sebelumnya yang tidak memberi tahu Anda apa-apa ... dapat, yah, benar-benar memberi tahu Anda sesuatu?

Ternyata beberapa metode yang telah saya gunakan dalam R menggunakan campuran metode Bayesian dan Frequentist (penulis mengakui ini agak tidak konsisten) dan saya bahkan tidak bisa membedakan bagian mana yang Bayesian. Selain pas distribusi, saya bahkan tidak tahu BAGAIMANA Anda akan menggunakan metode Bayesian. Apakah ada "regresi Bayesian"? Terlihat seperti apa? Yang bisa saya bayangkan adalah menebak distribusi yang mendasarinya berulang-ulang sementara Frequentist berpikir tentang data beberapa, melihat itu, melihat distribusi Poisson dan menjalankan GLM. (Ini bukan kritik ... Aku benar-benar tidak mengerti!)

Jadi. Mungkin beberapa contoh dasar akan membantu? Dan jika Anda mengetahui beberapa referensi praktis untuk pemula sejati seperti saya, itu akan sangat membantu juga!


Kemungkinan duplikat ini ?
Glen_b -Reinstate Monica

Eh, sepertinya? Selamat datang untuk menutup karena itu hampir menjawab pertanyaan saya. Saya masih bertanya-tanya tentang situasi yang lebih sederhana yang saya jelaskan (karena saya belum pernah mendengar tentang teknik yang tercantum pada utas itu) tetapi saya kira jawaban saya adalah bahwa orang TIDAK menggunakan teknik bayesian untuk regresi / dll karena teknik yang sering dan mudah ada?
HFBrowning

2
Orang memang menggunakan teknik Bayesian untuk regresi. Tetapi karena metode frequentist sangat nyaman dan banyak orang pragmatis tentang pendekatan mana yang mereka gunakan, sehingga sering orang yang senang menggunakan salah satu akan menggunakan regresi biasa jika tidak perlu untuk sesuatu yang lebih rumit. Tetapi segera setelah Anda perlu berurusan dengan kompleksitas yang lebih sedikit, atau untuk secara formal memasukkan informasi sebelumnya, atau sejumlah alasan lainnya, maka pekerjaan tambahan sederhana dalam pendekatan Bayesian mulai terlihat bagus.
Glen_b -Reinstate Monica

Masuk akal, terima kasih. Membaca di sekitar beberapa utas lainnya telah menjelaskan kegunaan untuk saya juga.
HFBrowning

Sesuatu yang lain yang relevan .. untuk regresi dalam pengaturan Bayesian, prior yang paling sering digunakan untuk koefisien adalah Normal multivarian dan Laplace multivariat. Menggunakan prior ini bekerja untuk menempatkan hukuman penyusutan pada koefisien, membuat mereka setara dengan menggunakan regresi ridge atau LASSO, masing-masing, jika seseorang mengambil estimasi MAP dari koefisien setelah algoritma Bayesian. Jauh lebih ekonomis untuk menghitung hasil ini dengan cara yang tidak sepenuhnya Bayesian, dan jika mereka pada dasarnya setara .. mengapa repot-repot?

Jawaban:


11

Berikut ini beberapa tautan yang mungkin menarik bagi Anda untuk membandingkan metode frequentist dan Bayesian:

Singkatnya, cara saya memahaminya, diberikan satu set data tertentu, sering percaya bahwa ada benar, distribusi yang mendasari dari mana kata data dihasilkan. Ketidakmampuan untuk mendapatkan parameter yang tepat adalah fungsi dari ukuran sampel yang terbatas. Bayesian, di sisi lain, berpikir bahwa kita mulai dengan beberapa asumsi tentang parameter (bahkan jika tanpa sadar) dan menggunakan data untuk memperbaiki pendapat kami tentang parameter tersebut. Keduanya berusaha mengembangkan model yang dapat menjelaskan pengamatan dan membuat prediksi; perbedaannya ada pada asumsi (baik aktual dan filosofis). Sebagai pernyataan yang bernas, tidak ketat, dapat dikatakan bahwa frequentist percaya bahwa parameternya tetap dan datanya acak; Bayesian percaya bahwa data sudah diperbaiki dan parameternya acak. Mana yang lebih baik atau lebih disukai? Untuk menjawab itu Anda harus menggali dan menyadari secara adilasumsi apa yang diperlukan oleh masing-masing (misalnya parameter asimtotik normal?).


2
Banyak jawaban bagus dan menarik, tetapi ini menjawab pertanyaan saya paling langsung. Terima kasih
HFBrowning

@Avraham tautan pertama rusak
Erik Hambardzumyan

1
@ErikHambardzumyan Terima kasih. Menemukan versi yang disimpan di mesin wayback.
Avraham

10

Salah satu aspek yang menarik dari kontras antara kedua pendekatan itu adalah sangat sulit untuk memiliki interpretasi formal untuk banyak kuantitas yang kita peroleh dalam domain frequentist. Salah satu contoh adalah semakin pentingnya metode hukuman (penyusutan). Ketika seseorang mendapatkan estimasi kemungkinan maksimum yang dihukum, estimasi titik bias dan "interval kepercayaan" sangat sulit untuk ditafsirkan. Di sisi lain, distribusi posterior Bayesian untuk parameter yang dihukum terhadap nol menggunakan distribusi sebelumnya yang terkonsentrasi di sekitar nol memiliki interpretasi standar sepenuhnya.


1
Ini poin yang bagus. Saya bertanya-tanya apakah itu terutama benar ketika lambda dipilih a-priori. Seringkali, orang dapat memilih lambda menggunakan validasi silang untuk mengoptimalkan kesalahan prediksi sampel keluar. Dalam hal ini, saya merasa aneh mengatakan bahwa lambda sama dengan 'informasi sebelumnya' yang Anda bawa ke analisis.
gung - Reinstate Monica

1
λ=σ2λ

3
Saya akan mengatakan Lambda adalah parameter-hyper dari prior (yang lebih Bayesian Anda bisa memiliki hyper-prior dan memarginalkan itu juga jmlr.org/papers/volume8/cawley07a/cawley07a.pdf )
Dikran Marsupial

5

Saya mencuri grosir ini dari grup pengguna Stan. Michael Betancourt memberikan diskusi yang sangat bagus tentang pengidentifikasian ini dalam kesimpulan Bayesian, yang saya yakin sesuai dengan permintaan Anda untuk kontras dari dua sekolah statistik.

Perbedaan pertama dengan analisis Bayesian adalah kehadiran prior yang, bahkan ketika lemah, akan membatasi massa posterior untuk 4 parameter menjadi lingkungan terbatas (jika tidak, Anda tidak akan memiliki valid sebelumnya di tempat pertama). Meskipun demikian, Anda masih dapat memiliki non-identifikasi dalam arti bahwa posterior tidak akan menyatu ke titik massa dalam batas data tak terbatas. Dalam arti yang sangat nyata, bagaimanapun, itu tidak masalah karena (a) batas data tak terbatas tidak nyata dan (b) kesimpulan Bayesian tidak melaporkan perkiraan titik melainkan distribusi. Dalam praktiknya, non-identifikasi akan menghasilkan korelasi besar antara parameter (bahkan mungkin non-konveksitas) tetapi analisis Bayesian yang tepat akan mengidentifikasi korelasi tersebut. Bahkan jika Anda melaporkan marginal parameter tunggal, Anda

μ1μ2N(x|μ1+μ2,σ)μ1+μ2=0μ1μ2

μ1μ2μ1μ2


3

Perbedaan utama antara pendekatan Bayesian dan frequentist terletak pada definisi probabilitas, jadi jika perlu untuk memperlakukan probabilties secara ketat sebagai frekuensi jangka panjang maka pendekatan frequentist masuk akal, jika tidak maka Anda harus menggunakan pendekatan Bayesian. Jika salah satu interpretasi dapat diterima, maka pendekatan Bayesian dan frequentist cenderung masuk akal.

Cara lain untuk menjelaskannya adalah jika Anda ingin tahu kesimpulan apa yang dapat Anda ambil dari eksperimen tertentu, Anda mungkin ingin menjadi orang Bayesian; jika Anda ingin menarik kesimpulan tentang beberapa populasi percobaan (misalnya kontrol kualitas) maka metode yang sering digunakan sangat cocok.

Intinya, yang penting adalah mengetahui pertanyaan apa yang ingin Anda jawab, dan pilih bentuk analisis yang paling langsung menjawab pertanyaan itu.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.