Ph.D. saya dalam matematika murni, dan saya akui saya tidak tahu banyak (yaitu apa-apa) tentang CS teoritis. Namun, saya telah mulai mengeksplorasi pilihan non-akademik untuk karir saya dan dalam memperkenalkan diri pada pembelajaran mesin, menemukan pernyataan seperti "Tidak ada yang mengerti mengapa jaringan saraf bekerja dengan baik," yang menurut saya menarik.
Pertanyaan saya, pada dasarnya, adalah jawaban seperti apa yang diinginkan peneliti? Inilah yang saya temukan dalam pencarian singkat saya pada topik:
- Algoritma yang mengimplementasikan jaringan saraf sederhana cukup mudah.
- Proses SGD dipahami dengan baik secara matematis, seperti teori statistik.
- Teorema aproksimasi universal sangat kuat dan terbukti.
- Ada makalah terbaru yang bagus https://arxiv.org/abs/1608.08225 yang pada dasarnya memberikan jawaban bahwa perkiraan universal jauh lebih banyak daripada yang sebenarnya kita butuhkan dalam praktik karena kita dapat membuat asumsi penyederhanaan yang kuat tentang fungsi yang kita coba modelkan dengan jaringan syaraf.
Dalam makalah yang disebutkan di atas, mereka menyatakan (parafrase) "Algoritma GOFAI sepenuhnya dipahami secara analitis, tetapi banyak algoritma JST hanya dipahami secara heuristik." Teorema konvergensi untuk algoritma yang diterapkan adalah contoh pemahaman analitik yang tampaknya kita miliki tentang jaringan saraf, sehingga pernyataan pada tingkat umum ini tidak memberi tahu saya banyak tentang apa yang diketahui vs tidak dikenal atau apa yang akan dianggap "jawaban" . "
Para penulis menyarankan dalam kesimpulan bahwa pertanyaan-pertanyaan seperti batas efektif pada ukuran jaringan saraf yang dibutuhkan untuk memperkirakan polinomial tertentu terbuka dan menarik. Apa contoh lain dari pertanyaan analitik khusus matematis yang perlu dijawab untuk mengatakan bahwa kita "memahami" jaringan saraf? Apakah ada pertanyaan yang dapat dijawab dalam bahasa matematika yang lebih murni?
(Saya secara khusus memikirkan metode dalam teori representasi karena penggunaan fisika dalam makalah ini --- dan, egois, karena ini adalah bidang studi saya. Namun, saya juga dapat membayangkan bidang-bidang seperti teori kombinatorik / grafik, geometri aljabar , dan topologi menyediakan alat yang layak.)