Saya menggunakan jaringan saraf untuk sebagian besar masalah. Intinya adalah bahwa itu dalam banyak kasus lebih banyak tentang pengalaman pengguna daripada tentang model. Berikut adalah beberapa alasan mengapa saya suka NNs.
- Mereka fleksibel. Saya bisa melempar kerugian apa pun yang saya inginkan pada mereka: kehilangan engsel, kuadrat, entropi silang, apa saja. Selama bisa dibedakan, saya bahkan bisa merancang kerugian yang pas dengan kebutuhan saya.
- Mereka dapat diperlakukan secara probabilistik: jaringan saraf Bayesian, variational Bayes, MLE / MAP, semuanya ada di sana. (Tetapi dalam beberapa kasus lebih sulit.)
- Mereka cepat. Kebanyakan MLP akan terdiri dari dua perkalian matriks dan satu komponen nonlinier yang diterapkan secara bijaksana. Kalahkan itu dengan SVM.
Saya akan membahas poin Anda yang lain selangkah demi selangkah.
Memiliki teori pendirian yang kuat
Saya akan mengatakan, NN sama kuatnya dalam hal itu: karena Anda melatih mereka dalam kerangka kerja probabilistik. Itu memungkinkan penggunaan prior dan perawatan Bayesian (misalnya dengan teknik atau pendekatan variasional) menjadi mungkin.
Mencapai global optimal karena pemrograman kuadratik
Untuk satu set hiperparameter. Namun, pencarian hps yang baik adalah non-cembung, dan Anda tidak akan tahu apakah Anda juga menemukan global optimal.
Tidak memiliki masalah untuk memilih jumlah parameter yang tepat
Dengan SVM, Anda harus memilih parameter hiper juga.
Membutuhkan lebih sedikit memori untuk menyimpan model prediksi
Anda perlu menyimpan vektor dukungan. SVM pada umumnya tidak akan lebih murah untuk menyimpan MLP, tergantung pada kasusnya.
Menghasilkan hasil yang lebih mudah dibaca dan interpretasi geometris
Lapisan atas MLP adalah regresi logistik dalam kasus klasifikasi. Dengan demikian, ada interpretasi geometris (memisahkan bidang hiper) dan interpretasi probabilistik juga.