Saya berurusan dengan masalah deteksi penipuan (seperti penilaian kredit). Dengan demikian ada hubungan yang sangat tidak seimbang antara pengamatan yang curang dan yang tidak curang.
http://blog.revolutionanalytics.com/2016/03/com_class_eval_metrics_r.html memberikan gambaran yang bagus tentang berbagai metrik klasifikasi. Precision and Recall
atau kappa
keduanya tampaknya menjadi pilihan yang baik:
Salah satu cara untuk membenarkan hasil pengklasifikasi tersebut adalah dengan membandingkannya dengan pengklasifikasi awal dan menunjukkan bahwa mereka memang lebih baik daripada prediksi peluang acak.
Sejauh yang saya mengerti, kappa
bisa menjadi pilihan yang sedikit lebih baik di sini, karena kesempatan acak diperhitungkan. Dari Cohen kappa dalam bahasa Inggris, saya mengerti bahwa kappa
berkaitan dengan konsep perolehan informasi:
[...] Akurasi Teramati sebesar 80% jauh lebih mengesankan dengan Akurasi yang Diharapkan 75% versus Akurasi yang Diharapkan 50% [...]
Karena itu, pertanyaan saya adalah:
- Apakah benar menganggap
kappa
sebagai metrik klasifikasi yang lebih cocok untuk masalah ini? - Apakah hanya menggunakan
kappa
mencegah efek negatif dari ketidakseimbangan pada algoritma klasifikasi? Apakah belajar ulang (turun / naik) berbasis sampel atau berbasis biaya (lihat http://www.icmc.usp.br/~mcmonard/public/laptec2002.pdf ) masih diperlukan?