Saya mencoba memahami pekerjaan dalam Hamiltonian Monte Carlo (HMC), tetapi tidak dapat sepenuhnya memahami bagian ketika kita mengganti integrasi waktu deterministik dengan proposal Metropolis-Hasting. Saya membaca makalah pengantar yang luar biasa A Pengantar Konseptual untuk Hamiltonian Monte Carlo oleh Michael Betancourt, jadi saya akan mengikuti notasi yang sama yang digunakan di dalamnya.
Latar Belakang
Tujuan umum Markov Chain Monte Carlo (MCMC) adalah untuk memperkirakan distribusi dari variabel target .
Ide HMC adalah untuk memperkenalkan tambahan "momentum" variabel , dalam hubungannya dengan variabel asli yang dimodelkan sebagai "posisi". Pasangan posisi-momentum membentuk ruang fase yang diperluas dan dapat dijelaskan oleh dinamika Hamilton. Distribusi gabungan dapat ditulis dalam istilah dekomposisi mikrokanonikal:
,
di mana mewakili parameter pada tingkat energi diberikan , juga dikenal sebagai himpunan tipikal . Lihat Gbr. 21 dan Gbr. 22 kertas untuk ilustrasi.
Prosedur HMC asli terdiri dari dua langkah bergantian berikut:
Langkah stokastik yang melakukan transisi acak antara level energi, dan
Langkah deterministik yang melakukan integrasi waktu (biasanya diimplementasikan melalui integrasi numerik leapfrog) di sepanjang tingkat energi yang diberikan.
Dalam makalah ini, dikatakan bahwa leapfrog (atau integrator symplectic) memiliki kesalahan kecil yang akan menyebabkan bias numerik. Jadi, alih-alih memperlakukannya sebagai langkah deterministik, kita harus mengubahnya menjadi proposal Metropolis-Hasting (MH) untuk menjadikan langkah ini stokastik, dan prosedur yang dihasilkan akan menghasilkan sampel yang tepat dari distribusi.
Pertanyaan
Pertanyaan saya adalah:
1) Mengapa modifikasi ini mengubah integrasi waktu deterministik menjadi proposal MH membatalkan bias numerik sehingga sampel yang dihasilkan mengikuti persis target distribusi?
2) Dari sudut pandang fisika, energi dilestarikan pada tingkat energi tertentu. Itu sebabnya kami dapat menggunakan persamaan Hamilton: