Dalam " Jaringan keyakinan mendalam konvolusional untuk pembelajaran terwakili terwakili terwakili " oleh Lee et. al. ( PDF ) DBN konvolusional diusulkan. Juga metode dievaluasi untuk klasifikasi gambar. Ini terdengar logis, karena ada fitur gambar lokal alami, seperti sudut dan tepi kecil dll.
Dalam " Pembelajaran fitur tanpa pengawasan untuk klasifikasi audio menggunakan jaringan keyakinan mendalam convolutional " oleh Lee et. Al. metode ini diterapkan untuk audio dalam berbagai jenis klasifikasi. Identifikasi pembicara, identifikasi gender, klasifikasi telepon dan juga beberapa genre musik / klasifikasi artis.
Bagaimana bagian konvolusional dari jaringan ini ditafsirkan untuk audio, seperti dapat dijelaskan untuk gambar sebagai tepi?