Komponen yang dapat dimodifikasi dari sistem pembelajaran yang bertanggung jawab atas keberhasilan atau kegagalannya? Perubahan apa yang mereka lakukan untuk meningkatkan kinerja? Ini telah disebut masalah penugasan kredit mendasar (Minsky, 1963). Ada metode penetapan kredit umum untuk pemecah masalah universal yang optimal waktu dalam berbagai pengertian teoretis (Bagian 6.8). Namun, survei ini akan fokus pada sub-bidang Deep Learning (DL) yang lebih sempit, tetapi sekarang penting secara komersial dalam Jaringan Syaraf Tiruan (NNs).
Standar jaringan saraf (NN) terdiri dari banyak prosesor sederhana yang terhubung yang disebut neuron, masing-masing menghasilkan urutan aktivasi bernilai nyata. Neuron input diaktifkan melalui sensor yang memahami lingkungan, neuron lain diaktifkan melalui koneksi tertimbang dari neuron yang sebelumnya aktif (rincian dalam Bagian 2). Beberapa neuron dapat memengaruhi lingkungan dengan memicu tindakan. Tugas belajar atau kredit adalah tentang menemukan bobot yang membuat NN menunjukkan perilaku yang diinginkan, seperti mengendarai mobil. Tergantung pada masalah dan bagaimana neuron terhubung, perilaku tersebut mungkin memerlukan rantai sebab akibat yang panjang dari tahap komputasi (Bagian 3), di mana setiap tahap mengubah (sering dengan cara non-linear) aktivasi agregat jaringan. Deep Learning adalah tentang memberikan kredit secara akurat di berbagai tahapan tersebut.
Model seperti NN dangkal dengan beberapa tahapan seperti telah ada selama beberapa dekade jika tidak berabad-abad (Bagian 5.1). Model dengan beberapa lapisan neuron nonlinier berurutan telah ada sejak tahun 1960an (Bagian 5.3) dan 1970an (Bagian 5.5). Metode gradient descent yang efisien untuk Supervisi Pembelajaran (SL) berbasis guru di jaringan terpisah yang terdiferensiasi dan berbeda yang disebut backpropagation (BP) dikembangkan secara terpisah pada 1960-an dan 1970-an, dan diterapkan pada NNs pada 1981 (Bagian 5.5). Namun, pelatihan berbasis NNs berbasis BP dengan banyak lapisan, ternyata sulit dilakukan pada akhir 1980-an (Bagian 5.6), dan telah menjadi subjek penelitian eksplisit pada awal 1990-an (Bagian 5.9). DL menjadi praktis layak sampai batas tertentu melalui bantuan Unsupervised Learning (UL), misalnya, Sec. 5.10 (1991), Sec. 5.15 (2006). 1990-an dan 2000-an juga melihat banyak perbaikan DL murni diawasi (Bagian 5). Dalam milenium baru, NN dalam akhirnya menarik perhatian luas, terutama dengan mengungguli metode pembelajaran mesin alternatif seperti mesin kernel (Vapnik, 1995; Scholkopf et al., 1998) dalam berbagai aplikasi penting. Bahkan, sejak 2009, NN dalam yang diawasi telah memenangkan banyak kompetisi pengenalan pola internasional resmi (misalnya, Bagian 5.17, 5.19, 5.21, 5.22), mencapai hasil pengenalan pola visual manusia super pertama dalam domain terbatas (Bagian 5.19, 2011). Deep NNs juga menjadi relevan untuk bidang yang lebih umum dari Reinforcement Learning (RL) di mana tidak ada guru pembimbing (Bagian 6). terutama dengan mengungguli metode pembelajaran mesin alternatif seperti mesin kernel (Vapnik, 1995; Scholkopf et al., 1998) dalam berbagai aplikasi penting. Bahkan, sejak 2009, NN dalam yang diawasi telah memenangkan banyak kompetisi pengenalan pola internasional resmi (misalnya, Bagian 5.17, 5.19, 5.21, 5.22), mencapai hasil pengenalan pola visual manusia super pertama dalam domain terbatas (Bagian 5.19, 2011). Deep NNs juga menjadi relevan untuk bidang yang lebih umum dari Reinforcement Learning (RL) di mana tidak ada guru pembimbing (Bagian 6). terutama dengan mengungguli metode pembelajaran mesin alternatif seperti mesin kernel (Vapnik, 1995; Scholkopf et al., 1998) dalam berbagai aplikasi penting. Bahkan, sejak 2009, NN dalam yang diawasi telah memenangkan banyak kompetisi pengenalan pola internasional resmi (misalnya, Bagian 5.17, 5.19, 5.21, 5.22), mencapai hasil pengenalan pola visual manusia super pertama dalam domain terbatas (Bagian 5.19, 2011). Deep NNs juga menjadi relevan untuk bidang yang lebih umum dari Reinforcement Learning (RL) di mana tidak ada guru pembimbing (Bagian 6). mencapai hasil pengenalan pola visual manusia super pertama dalam domain terbatas (Bagian 5.19, 2011). Deep NNs juga menjadi relevan untuk bidang yang lebih umum dari Reinforcement Learning (RL) di mana tidak ada guru pembimbing (Bagian 6). mencapai hasil pengenalan pola visual manusia super pertama dalam domain terbatas (Bagian 5.19, 2011). Deep NNs juga menjadi relevan untuk bidang yang lebih umum dari Reinforcement Learning (RL) di mana tidak ada guru pembimbing (Bagian 6).
Di sisi lain, saya tidak yakin bahwa itu selalu menguntungkan untuk mencoba dan membangun taksonomi ember yang saling eksklusif untuk strategi pembelajaran mesin. Saya pikir kita dapat mengatakan bahwa ada perspektif dari mana model dapat dilihat sebagai jaringan saraf. Saya tidak berpikir bahwa perspektif adalah yang terbaik atau berguna dalam semua konteks. Sebagai contoh, saya masih berencana untuk merujuk pada hutan acak dan gradien meningkatkan pohon sebagai "ansambel pohon" daripada mengabstraksi perbedaan mereka dan memanggil mereka "pohon jaringan saraf". Selain itu, Schmidhuber membedakan NN dari mesin kernel - meskipun mesin kernel memiliki beberapa koneksi ke NN - ketika ia menulis "Di milenium baru, NN dalam akhirnya menarik perhatian luas," terutama dengan mengungguli metode pembelajaran mesin alternatif seperti mesin kernel ... dalam berbagai aplikasi penting. "