Saya baru saja selesai membaca diskusi ini . Mereka berpendapat bahwa PR AUC lebih baik daripada ROC AUC pada dataset yang tidak seimbang.
Sebagai contoh, kami memiliki 10 sampel dalam dataset uji. 9 sampel positif dan 1 negatif. Kami memiliki model mengerikan yang memprediksi semuanya positif. Jadi, kita akan memiliki metrik bahwa TP = 9, FP = 1, TN = 0, FN = 0.
Kemudian, Precision = 0.9, Recall = 1.0. Presisi dan daya ingat keduanya sangat tinggi, tetapi kami memiliki klasifikasi yang buruk.
Di sisi lain, TPR = TP / (TP + FN) = 1.0, FPR = FP / (FP + TN) = 1.0. Karena FPR sangat tinggi, kami dapat mengidentifikasi bahwa ini bukan penggolong yang baik.
Jelas, ROC lebih baik daripada PR pada dataset yang tidak seimbang. Adakah yang bisa menjelaskan mengapa PR lebih baik?