Saya membaca makalah HMC pengantar yang luar biasa dari Prof. Michael Betancourt, tetapi saya terjebak dalam pemahaman bagaimana kita memilih pilihan distribusi momentum.
Ringkasan
Ide dasar dari HMC adalah untuk memperkenalkan variabel momentum dalam hubungannya dengan variabel target . Mereka bersama-sama membentuk ruang fase .
Energi total dari sistem konservatif adalah konstan dan sistem harus mengikuti persamaan Hamilton. Oleh karena itu, lintasan dalam ruang fase dapat diuraikan menjadi tingkat energi , setiap tingkat sesuai dengan nilai energi dan dapat digambarkan sebagai satu set titik yang memenuhi:
.
Kami ingin memperkirakan distribusi gabungan , sehingga dengan mengintegrasikan kami mendapatkan distribusi target yang diinginkan . Lebih lanjut, dapat secara ekivalen ditulis sebagai , di mana berkorespondensi dengan nilai energi tertentu dan adalah posisi pada tingkat energi itu.
Untuk nilai diberikan , relatif lebih mudah diketahui, karena kita dapat melakukan integrasi persamaan Hamilton untuk mendapatkan titik data pada lintasan. . Namun, adalah bagian yang rumit yang tergantung pada bagaimana kita menentukan momentum, yang akibatnya menentukan jumlah energi .
Pertanyaan
Tampak bagi saya bahwa apa yang kita kejar adalah , tetapi yang bisa kita perkirakan adalah , berdasarkan asumsi bahwa dapat kira-kira mirip dengan , seperti yang diilustrasikan dalam Gambar 23 dari makalah ini. Namun, apa yang sebenarnya kita sampel tampaknya adalah .
T1 : Apakah itu karena setelah kita tahu , kita dapat dengan mudah menghitung dan karenanya memperkirakan ?
Untuk membuat asumsi bahwa berlaku, kita menggunakan momentum terdistribusi Gaussian. Dua pilihan disebutkan di koran:
di mana adalah konstanta disebut metrik Euclidean, alias matriks massa .
Dalam kasus pilihan pertama (Euclidean-Gaussian), matriks massa sebenarnya tidak bergantung pada , jadi kemungkinan kita mengambil sampel sebenarnya adalah . Pilihan momentum terdistribusi Gaussian dengan kovarians menyiratkan bahwa variabel target terdistribusi Gaussian dengan matriks kovarians , karena dan perlu diubah secara terbalik untuk menjaga volume dalam ruang konstan fase .
T2 : Pertanyaan saya adalah bagaimana kita bisa mengharapkan untuk mengikuti distribusi Gaussian? Dalam praktiknya dapat berupa distribusi yang rumit.