4
Mengapa menambahkan dropout layer meningkatkan kinerja pembelajaran mesin / dalam, mengingat bahwa dropout menekan beberapa neuron dari model?
Jika menghapus beberapa neuron menghasilkan model yang berkinerja lebih baik, mengapa tidak menggunakan jaringan saraf yang lebih sederhana dengan lebih sedikit lapisan dan lebih sedikit neuron di tempat pertama? Mengapa membangun model yang lebih besar dan lebih rumit pada awalnya dan menekan bagian-bagiannya nanti?