Untuk jawaban yang panjang, lihat Blei, Kucukelbir, dan McAuliffe di sini . Jawaban singkat ini sangat menarik darinya.
- MCMC tepat asimtotik; VI tidak . Dalam batasnya, MCMC akan memperkirakan perkiraan target distribusi. VI datang tanpa jaminan.
- MCMC mahal secara komputasi . Secara umum, VI lebih cepat.
Artinya, ketika kita memiliki waktu komputasi untuk membunuh dan menilai ketepatan estimasi kita, MCMC menang. Jika kita bisa mentolerir pengorbanan itu demi kemanfaatan — atau kita bekerja dengan data yang begitu besar kita harus melakukan pertukaran — VI adalah pilihan alami.
Atau, seperti yang lebih fasih dan tuntas dijelaskan oleh penulis yang disebutkan di atas:
Dengan demikian, inferensi variasional cocok untuk set data besar dan skenario di mana kami ingin cepat mengeksplorasi banyak model; MCMC cocok untuk set data yang lebih kecil dan skenario di mana kami dengan senang hati membayar biaya komputasi yang lebih berat untuk sampel yang lebih tepat. Sebagai contoh, kita dapat menggunakan MCMC dalam pengaturan di mana kita menghabiskan 20 tahun mengumpulkan kumpulan data yang kecil tapi mahal, di mana kita yakin bahwa model kita sesuai, dan di mana kita memerlukan kesimpulan yang tepat. Kami mungkin menggunakan inferensi variasional ketika menyesuaikan model teks probabilistik dengan satu miliar dokumen teks dan di mana inferensi akan digunakan untuk menyajikan hasil pencarian kepada populasi pengguna yang besar. Dalam skenario ini, kita dapat menggunakan perhitungan terdistribusi dan optimisasi stokastik untuk meningkatkan dan mempercepat inferensi, dan kita dapat dengan mudah mengeksplorasi banyak model data yang berbeda.