Sebuah jawaban menarik ditawarkan di sini:
https://github.com/dice-group/gerbil/wiki/Precision,-Recall-and-F1-measure
Penulis modul menghasilkan skor yang berbeda untuk presisi dan mengingat tergantung pada apakah benar positif, positif palsu dan negatif palsu semua 0. Jika mereka, hasilnya seolah-olah bagus.
Dalam beberapa kasus yang jarang terjadi, penghitungan Precision atau Recall dapat menyebabkan pembagian dengan 0. Mengenai presisi, ini dapat terjadi jika tidak ada hasil di dalam jawaban annotator dan, dengan demikian, benar dan positif palsu adalah 0. Untuk kasus khusus ini, kami telah menetapkan bahwa jika positif asli, positif salah dan negatif palsu semuanya 0, ketepatan, penarikan kembali dan ukuran F1 adalah 1. Ini mungkin terjadi dalam kasus di mana standar emas berisi dokumen tanpa anotasi dan anotator (dengan benar) tidak mengembalikan anotasi. Jika benar positif adalah 0 dan salah satu dari dua penghitung lainnya lebih besar dari 0, ketepatan, penarikan kembali dan ukuran-F1 adalah 0.
Saya tidak yakin apakah jenis penilaian ini akan berguna dalam situasi lain di luar kasus khusus mereka, tetapi ada baiknya dipikirkan.