Pertama-tama, saya menemukan "akurasi" kadang-kadang agak menyesatkan, karena merujuk pada hal-hal yang berbeda:
Istilah akurasi dalam genal untuk mengevaluasi sistem atau metode (saya ahli kimia analitik) mengacu pada bias prediksi, yaitu menjawab pertanyaan seberapa baik prediksi rata-rata.
Seperti yang Anda ketahui, ada banyak ukuran kinerja berbeda yang menjawab berbagai aspek kinerja untuk pengklasifikasi. Salah satunya kebetulan disebut akurasi juga. Jika makalah Anda bukan untuk audiens pembelajaran mesin / klasifikasi, saya sarankan untuk membuat perbedaan ini sangat jelas. Bahkan untuk makna akurasi yang lebih spesifik ini, saya akan sangat eksplisit tentang apa yang saya sebut akurasi karena sekali lagi beberapa cara untuk mengatasi ketidakseimbangan kelas dapat terjadi. Biasanya, ketidakseimbangan kelas diabaikan, yang mengarah ke perhitungan . Namun, Anda juga dapat menggunakan rata-rata sensitivitas dan spesifisitas, yang berarti mengendalikan ketidakseimbangan kelas dengan memberi bobot rata-rata.TP+ TNa l l c a s e s
The F-skor sering diperkenalkan sebagai mean harmonik presisi dan recall (atau nilai prediktif positif dan sensitivitas). Untuk pertanyaan Anda, saya pikir sangat membantu untuk menjelaskannya sedikit lebih jauh dan menyederhanakannya:
F= 2 ⋅ p r e c i s i o n ⋅ r e c a l lp r e c i s i o n + r e c a l l= 2 TPa l l P TPa l l TTPa l l P + TPa l l T= 2 TP2a l l P ⋅ a l l TTP⋅ a l l T a l l P ⋅ a l l T+ TP⋅ a l l P a l l P ⋅ a l l T= 2 T P2TP⋅ a l l T + TP⋅ a l l P = 2 T Pa l l T + A l l P
Ungkapan terakhir bukanlah sebagian kecil dari apa pun yang dapat saya pikirkan sebagai kelompok kasus uji tertentu. Secara khusus, tumpang tindih (berat) antara kasus TRUE dan POSITIF diharapkan. Ini akan membuat saya tidak menyatakan skor-F sebagai persentase seperti jenis yang menyiratkan proporsi kasus. Sebenarnya, saya pikir saya akan memperingatkan pembaca bahwa F-score tidak memiliki interpretasi seperti itu.