Mengapa MCMC diperlukan saat memperkirakan parameter menggunakan MAP


11

Mengingat rumus untuk estimasi MAP dari suatu parameter Estimasi parameter MAP Mengapa diperlukan pendekatan MCMC (atau serupa), tidak bisakah saya mengambil turunannya, menetapkannya menjadi nol dan kemudian menyelesaikannya untuk parameter?


Pertanyaan bagus!

Jawaban:


4

Jika Anda tahu dari keluarga mana posterior Anda berasal dan jika menemukan turunan dari distribusi itu layak secara analitik, itu benar.

Namun, ketika Anda menggunakan MCMC, Anda kemungkinan tidak akan berada dalam situasi seperti itu. MCMC dibuat untuk situasi di mana Anda tidak memiliki gagasan analitis yang jelas tentang bagaimana posterior Anda terlihat.


3
Saya pikir ini sedikit menyesatkan: MCMC biasanya tidak digunakan untuk menemukan penaksir MAP (di luar kasus khusus seperti algoritma MCEM).
Cliff AB

1
Saya tidak setuju dengan Anda pada prinsipnya. Tetapi, MCMC dapat dan digunakan untuk mensimulasikan distribusi posterior . Dan setelah Anda selesai melakukannya, Anda pasti dapat menemukan mode distribusi itu, alias MAP. Itulah, saya percaya, apa yang ada dalam pikiran OP, jadi saya tidak yakin mengapa jawaban saya akan menyesatkan.
Christoph Hanck

Ya, apakah MCMC adalah metode pilihan ketika berhadapan dengan MAP jika tidak ada cara analitis untuk mengoptimalkan parameter?
Dänu

3
Saya belum pernah mendengar menggunakan MCMC sederhana untuk menemukan mode distribusi posterior (secara teknis, itu bisa dilakukan, tetapi ini sangat tidak efisien). Karena kita biasanya dapat mengevaluasi fungsi yang proporsional dengan distribusi posterior, memaksimalkan ini akan setara dengan memaksimalkan distribusi posterior. Pengoptimal out of the box akan bekerja dengan baik pada ini sebagai masalah kemungkinan sering (yaitu, kadang-kadang Anda perlu mengkhususkan mereka).
Cliff AB

@ Dänu Anda mungkin tidak ingin menggunakan MCMC (menjadi pedantic, rantai Markov) untuk menemukan maxima. Algoritme optimasi harus bekerja lebih baik.
jtobin

10

Sebagian besar posisi terbukti sulit untuk dioptimalkan secara analitik (yaitu dengan mengambil gradien dan menyetelnya sama dengan nol), dan Anda harus menggunakan beberapa algoritma optimasi numerik untuk melakukan MAP.

Sebagai tambahan: MCMC tidak terkait dengan MAP.

MAP - untuk maksimum a posteriori - mengacu pada menemukan maksimum lokal dari sesuatu yang sebanding dengan kepadatan posterior dan menggunakan nilai parameter yang sesuai sebagai perkiraan. Ini didefinisikan sebagai

θ^MAP=argmaxθp(θ|D)

MCMC biasanya digunakan untuk memperkirakan ekspektasi atas sesuatu yang sebanding dengan kepadatan probabilitas. Dalam kasus posterior, itu

θ^MCMC=n1i=1nθi0Θθp(θ|D)dθ

di mana adalah kumpulan posisi ruang parameter yang dikunjungi oleh rantai Markov yang sesuai. Secara umum, dalam arti yang berarti.θ M A Pθ M C M C{θi0}i=1nθ^MAPθ^MCMC

Intinya adalah bahwa MAP melibatkan optimasi , sedangkan MCMC didasarkan pada pengambilan sampel .


Anda menyatakan bahwa eksterior terbukti sulit untuk dioptimalkan secara analitis, yang merupakan kasus dalam MAP. Jadi apakah MAP hanya mungkin jika posterior dapat dioptimalkan secara analitis dan jika ini bukan masalahnya, maka seseorang harus menggunakan (misalnya) pendekatan MCMC?
Donna

2
Tidak, alih-alih datang dengan solusi analitis, seseorang dapat menggunakan algoritma iteratif untuk menghasilkan solusi (yaitu jika posterior log cekung, Anda dapat menggunakan Metode Newton, misalnya).
Cliff AB

2
MAP mengacu pada menemukan nilai parameter yang (secara lokal) memaksimalkan posterior. Tidak masalah bagaimana seseorang mendapatkan nilai parameter tersebut: penyelesaian untuk maxima analitik, menggunakan rutin numerik, diferensiasi otomatis, dll.
jtobin
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.