Saya mengerti bahwa pelatihan awal digunakan untuk menghindari beberapa masalah dengan pelatihan konvensional. Jika saya menggunakan backpropagation dengan, katakanlah autoencoder, saya tahu saya akan mengalami masalah waktu karena backpropagation lambat, dan saya juga bisa terjebak dalam optima lokal dan tidak mempelajari fitur-fitur tertentu.
Apa yang saya tidak mengerti adalah bagaimana kita melakukan pra-jaringan dan apa yang khusus kita lakukan untuk melakukan pra-latihan. Sebagai contoh, jika kita diberi setumpuk Mesin Boltzmann yang dibatasi, bagaimana kita melakukan prapembaruan jaringan ini?