Saya baru belajar mendalam, jadi ini mungkin pertanyaan sepele. Tetapi saya bertanya-tanya mengapa pembelajaran yang mendalam (atau jaringan saraf) tidak bekerja dengan baik pada data berlabel kecil. Apa pun makalah penelitian yang saya baca, dataset mereka sangat besar. Secara intuitif itu tidak mengejutkan karena otak kita membutuhkan banyak waktu untuk melatih dirinya sendiri. Tetapi apakah ada bukti atau alasan matematis mengapa jaringan saraf tidak bekerja dengan baik dalam kasus seperti itu?