Saya memiliki beberapa keraguan tentang ukuran kinerja yang digunakan, area di bawah kurva ROC (TPR sebagai fungsi FPR) atau area di bawah kurva recall-presisi (presisi sebagai fungsi recall).
Data saya tidak seimbang, yaitu jumlah instance negatif jauh lebih besar daripada instance positif.
Saya menggunakan prediksi keluaran weka, sampelnya adalah:
inst#,actual,predicted,prediction
1,2:0,2:0,0.873
2,2:0,2:0,0.972
3,2:0,2:0,0.97
4,2:0,2:0,0.97
5,2:0,2:0,0.97
6,2:0,2:0,0.896
7,2:0,2:0,0.973
Dan saya menggunakan pROC dan pustaka ROCR.