Latar belakang: Banyak penelitian modern dalam ~ 4 tahun terakhir (post alexnet ) tampaknya telah beralih dari menggunakan pretraining generatif untuk jaringan saraf untuk mencapai hasil klasifikasi seni yang mutakhir.
Sebagai contoh, hasil teratas untuk mnist di sini hanya mencakup 2 makalah dari 50 teratas tampaknya menggunakan model generatif, yang keduanya adalah RBM. 48 makalah pemenang lainnya adalah tentang arsitektur umpan maju yang berbeda dengan banyak upaya yang dilakukan untuk menemukan inisialisasi berat / novel yang lebih baik dan fungsi aktivasi berbeda dari sigmoid yang digunakan dalam RBM dan di banyak jaringan saraf yang lebih tua.
Pertanyaan: Apakah ada alasan modern untuk menggunakan Mesin Boltzmann Terbatas lagi?
Jika tidak, adakah modifikasi de facto yang dapat diterapkan pada arsitektur umpan maju ini untuk membuat lapisannya generatif?
Motivasi: Saya bertanya karena beberapa model yang saya lihat tersedia, biasanya varian pada RBM, tidak perlu memiliki mitra diskriminatif analog yang jelas untuk lapisan / model generatif ini, dan sebaliknya. Sebagai contoh:
CRBM (meskipun orang dapat berpendapat bahwa CNN menggunakan arsitektur umpan maju adalah arsitektur analog yang diskriminatif)
Juga, ini jelas pra alexnet juga, dari 2010, 2011, dan 2009 dengan hormat.