Saya memperingatkan agar tidak ada kemiripan yang kuat antara jaringan saraf biologis dan buatan. Saya pikir nama "jaringan saraf" agak berbahaya, karena menipu orang untuk berharap bahwa proses neurologis dan pembelajaran mesin harus sama. Perbedaan antara jaringan syaraf biologis dan buatan lebih besar daripada kesamaan.
Sebagai contoh bagaimana hal ini bisa salah, Anda juga dapat mengubah alasan di pos asli di kepalanya. Anda dapat melatih jaringan saraf untuk belajar mengenali mobil di siang hari, asalkan Anda memiliki komputer yang cukup cepat dan sejumlah data pelatihan. Anda dapat menjadikan ini tugas biner (mobil / bukan mobil) atau tugas multi-kelas (mobil / trem / sepeda / pesawat / kapal) dan masih percaya diri dalam tingkat kesuksesan yang tinggi.
Sebaliknya, saya tidak akan mengharapkan seorang anak untuk dapat memilih mobil hari - atau bahkan minggu - setelah lahir, bahkan setelah melihat "begitu banyak contoh pelatihan." Sesuatu yang jelas berbeda antara anak berusia dua tahun dan bayi yang menjelaskan perbedaan dalam kemampuan belajar, sedangkan jaringan saraf klasifikasi gambar vanila sangat mampu mengambil klasifikasi objek segera setelah "kelahiran." Saya pikir ada dua perbedaan penting: (1) volume relatif dari data pelatihan yang tersedia dan (2) mekanisme pengajaran mandiri yang berkembang seiring waktu karena banyaknya data pelatihan.
Posting asli memaparkan dua pertanyaan. Judul dan isi pertanyaan bertanya mengapa jaringan saraf membutuhkan "begitu banyak contoh." Relatif dengan pengalaman anak, jaringan saraf dilatih menggunakan tolok ukur gambar umum memiliki data yang relatif sedikit.
Saya akan mengulangi pertanyaan dalam judul untuk
"Bagaimana melatih jaringan saraf untuk tolok ukur gambar umum dibandingkan & kontras dengan pengalaman belajar seorang anak?"
Demi perbandingan, saya akan mempertimbangkan data CIFAR-10 karena ini adalah tolok ukur gambar yang umum. Bagian berlabel terdiri dari 10 kelas gambar dengan 6000 gambar per kelas. Setiap gambar berukuran 32x32 piksel. Jika Anda entah bagaimana menumpuk gambar berlabel dari CIFAR-10 dan membuat video standar 48 fps, Anda akan memiliki sekitar 20 menit rekaman.
Seorang anak berusia 2 tahun yang mengamati dunia selama 12 jam setiap hari memiliki sekitar 263.000 menit (lebih dari 4000 jam) pengamatan langsung dunia, termasuk umpan balik dari orang dewasa (label). (Ini hanya angka rata-rata - Saya tidak tahu berapa menit yang dihabiskan oleh seorang anak berusia dua tahun yang khas untuk mengamati dunia.) Selain itu, anak tersebut akan terpapar pada banyak, banyak objek di luar 10 kelas yang terdiri dari CIFAR- 10.
Jadi ada beberapa hal yang berperan. Salah satunya adalah bahwa anak memiliki paparan lebih banyak data secara keseluruhan dan sumber data yang lebih beragam daripada model CIFAR-10. Keragaman data dan volume data diakui dengan baik sebagai prasyarat untuk model yang kuat secara umum. Dalam hal ini, tidak mengherankan bahwa jaringan saraf lebih buruk dalam tugas ini daripada anak, karena jaringan saraf yang dilatih tentang CIFAR-10 secara positif kekurangan data pelatihan dibandingkan dengan anak berusia dua tahun. Resolusi gambar yang tersedia untuk anak lebih baik daripada gambar 32x32 CIFAR-10, sehingga anak dapat mempelajari informasi tentang detail halus benda.
Perbandingan CIFAR-10 hingga dua tahun tidak sempurna karena model CIFAR-10 kemungkinan akan dilatih dengan beberapa lintasan melalui gambar statis yang sama, sementara anak akan melihat, menggunakan penglihatan binokular, bagaimana objek disusun dalam tiga -dimensi dunia sambil bergerak dan dengan kondisi pencahayaan dan perspektif yang berbeda pada objek yang sama.
Anekdot tentang anak OP menyiratkan pertanyaan kedua,
"Bagaimana jaringan saraf bisa menjadi otodidak?"
Seorang anak diberkahi dengan beberapa bakat untuk belajar sendiri, sehingga kategori objek baru dapat ditambahkan dari waktu ke waktu tanpa harus memulai dari awal.
Komentar OP tentang transfer-learning menamakan satu jenis adaptasi model dalam konteks pembelajaran mesin.
Dalam komentar, pengguna lain telah menunjukkan bahwa pembelajaran satu dan beberapa tembakan * adalah bidang penelitian pembelajaran mesin lainnya.
Selain itu, pembelajaran penguatan membahas model pembelajaran mandiri dari perspektif yang berbeda, yang pada dasarnya memungkinkan robot untuk melakukan percobaan coba-coba untuk menemukan strategi yang optimal untuk memecahkan masalah tertentu (misalnya bermain catur).
Mungkin benar bahwa ketiga paradigma pembelajaran mesin ini erat untuk meningkatkan bagaimana mesin beradaptasi dengan tugas-tugas visi komputer baru. Mengadaptasi model pembelajaran mesin dengan cepat ke tugas-tugas baru adalah bidang penelitian yang aktif. Namun, karena tujuan praktis dari proyek-proyek ini (mengidentifikasi contoh baru malware, mengenali penipu dalam foto paspor, mengindeks internet) dan kriteria untuk sukses berbeda dari tujuan anak yang belajar tentang dunia, dan kenyataan bahwa seseorang melakukannya di komputer menggunakan matematika dan yang lainnya dilakukan dalam bahan organik menggunakan kimia, perbandingan langsung antara keduanya akan tetap penuh.
Selain itu, akan menarik untuk mempelajari cara membalik masalah CIFAR-10 dan melatih jaringan saraf untuk mengenali 6000 objek dari 10 contoh masing-masing. Tetapi bahkan ini tidak akan menjadi perbandingan yang adil untuk anak berusia 2 tahun, karena masih akan ada perbedaan besar dalam total volume, keragaman dan resolusi data pelatihan.
* Saat ini kami tidak memiliki tag untuk pembelajaran satu kali atau beberapa pembelajaran.