Menurut pendapat saya, ini subjektif dan masalah khusus. Anda harus menggunakan apa pun yang merupakan faktor terpenting dalam pikiran Anda sebagai metrik mengemudi, karena ini mungkin membuat keputusan Anda tentang bagaimana mengubah model yang lebih baik fokus.
Sebagian besar metrik yang dapat dihitung akan dikorelasikan / serupa dalam banyak hal: mis. Jika Anda menggunakan MSE untuk kerugian Anda, lalu merekam MAPE (rata-rata persentase kesalahan) atau kerugian sederhana , mereka akan memberi Anda kurva kehilangan yang sebanding.L.1
Misalnya, jika Anda akan melaporkan skor-F1 dalam laporan Anda / ke bos Anda, dll. (Dan dengan asumsi itulah yang benar-benar mereka pedulikan), maka menggunakan metrik itu akan sangat masuk akal. Skor F1, misalnya, memperhitungkan ketepatan dan penarikan kembali, yakni skor menggambarkan hubungan antara dua metrik berbutir halus .
Menyatukan semuanya, menghitung skor selain kerugian normal mungkin bagus untuk tinjauan umum dan untuk melihat bagaimana metrik akhir Anda dioptimalkan selama program iterasi pelatihan. Hubungan itu mungkin bisa memberi Anda wawasan yang lebih dalam tentang masalah tersebut,
Namun, biasanya yang terbaik adalah mencoba beberapa opsi, karena mengoptimalkan kehilangan validasi dapat memungkinkan pelatihan berjalan lebih lama, yang pada akhirnya juga dapat menghasilkan skor F1 yang superior . Ketepatan dan daya ingat mungkin bergoyang di sekitar beberapa minimum lokal, menghasilkan skor F1 yang hampir statis - sehingga Anda akan berhenti berlatih. Jika Anda telah mengoptimalkan kerugian murni, Anda mungkin telah mencatat fluktuasi kerugian yang cukup untuk memungkinkan Anda berlatih lebih lama.
cross_entropy
kerugian adalah kandidat yang lebih disukai daripadaMSE
atauMAE
. Lihat bagian Wrap-Up dari artikel ini , dan posting ini pada statistik .