Setiap contoh jaringan saraf untuk pengenalan gambar yang saya baca menghasilkan jawaban "ya" atau "tidak" yang sederhana. Satu simpul keluar berhubungan dengan "Ya, ini adalah wajah manusia," dan satu simpul terkait dengan "Tidak, ini bukan wajah manusia."
Saya mengerti bahwa ini mungkin untuk kesederhanaan penjelasan, tetapi saya bertanya-tanya bagaimana jaringan saraf dapat diprogram untuk memberikan hasil yang lebih spesifik. Sebagai contoh, katakanlah saya mengklasifikasikan hewan. Alih-alih mengatakan "Hewan" atau "Bukan binatang", saya ingin tanggapan seperti "Anjing", "Ikan", "Burung", "Ular", dll., Dengan satu simpul keluar terakhir adalah "Bukan binatang / saya tidak mengenali ini ".
Saya yakin ini pasti mungkin, tetapi saya kesulitan memahami caranya. Sepertinya karena algoritma pelatihan backpropogation of error, ketika Anda melatih satu simpul keluar (yaitu, "Ini adalah anjing") dan bobot neuron diubah, maka keadaan ideal untuk simpul keluar lain yang sebelumnya Anda terlatih (yaitu, "Ini adalah burung") akan mulai menyimpang, dan sebaliknya. Jadi, melatih jaringan untuk mengenali satu kategori akan menyabot pelatihan apa pun yang dilakukan untuk kategori lain, sehingga membatasi kita pada desain "Ya" atau "Tidak" yang sederhana.
Apakah ini membuat pengenal seperti itu tidak mungkin? Atau apakah saya salah memahami algoritma? Hanya dua hal yang dapat saya pikirkan adalah:
Entah kita bisa melatih satu jaringan saraf untuk setiap hal yang kita inginkan diklasifikasikan dan entah bagaimana menggunakannya untuk membangun jaringan super besar (jadi misalnya, jaringan untuk "anjing", jaringan untuk "burung", dll., Yang entah bagaimana kita tambahkan bersama untuk membuat jaringan super untuk "hewan"); atau,
Buat semacam metodologi pelatihan yang sangat rumit yang akan membutuhkan matematika yang sangat canggih dan entah bagaimana akan menghasilkan kondisi neuron-weight-ideal untuk semua output yang mungkin (dengan kata lain,
insert math magic here
).
(Catatan 1: Saya secara khusus melihat perceptrons multilayer sebagai semacam jaringan saraf.)
(Catatan 2: Untuk "solusi yang memungkinkan" yang pertama, memiliki masing-masing jaringan saraf spesifik dan mengulanginya sampai kami menerima jawaban "Ya" tidak cukup baik. Saya tahu ini bisa dilakukan dengan cukup mudah, tapi itu fungsional sederhana pemrograman daripada pembelajaran mesin. Saya ingin tahu apakah mungkin memiliki satu jaringan saraf untuk memberi makan informasi dan menerima respons yang sesuai.)