Manfaat utama yang diklaim:
(1) Tidak perlu fitur insinyur tangan untuk masalah pembelajaran non-linear (menghemat waktu dan terukur ke masa depan, karena teknik tangan dipandang oleh beberapa orang sebagai bantuan band jangka pendek)
(2) Fitur yang dipelajari terkadang lebih baik daripada fitur yang direkayasa dengan tangan terbaik, dan bisa sangat kompleks (visi komputer - misalnya fitur seperti wajah) sehingga butuh terlalu banyak waktu manusia untuk merekayasa.
(3) Dapat menggunakan data yang tidak berlabel untuk pra-melatih jaringan. Misalkan kita memiliki 1000000 gambar tidak berlabel dan 1000 gambar berlabel. Kita sekarang dapat secara drastis meningkatkan algoritma pembelajaran yang diawasi dengan pra-pelatihan pada 1000000 gambar yang tidak berlabel dengan pembelajaran yang mendalam. Selain itu, di beberapa domain kami memiliki banyak data yang tidak berlabel tetapi data berlabel sulit ditemukan. Algoritma yang dapat menggunakan data yang tidak berlabel ini untuk meningkatkan klasifikasi sangat berharga.
(4) Secara empiris, menghancurkan banyak tolok ukur yang hanya melihat peningkatan bertahap sampai diperkenalkannya metode pembelajaran yang mendalam.
(5) Algoritma yang sama berfungsi di banyak area dengan input mentah (mungkin dengan minor pre-processing).
(6) Terus membaik karena lebih banyak data dimasukkan ke jaringan (dengan asumsi distribusi stasioner dll).