Kumpulan metrik kesalahan yang dapat Anda pilih berbeda antara klasifikasi dan regresi. Dalam yang terakhir Anda mencoba untuk memprediksi satu nilai kontinu, dan dengan klasifikasi Anda memprediksi kelas diskrit seperti "sehat" atau "tidak sehat". Dari contoh yang Anda sebutkan, root mean square error akan berlaku untuk regresi dan AUC untuk klasifikasi dengan dua kelas.
Biarkan saya memberi Anda sedikit lebih detail tentang klasifikasi. Anda menyebutkan AUC sebagai ukuran, yang merupakan area di bawah kurva ROC, yang biasanya hanya diterapkan pada masalah klasifikasi biner dengan dua kelas. Meskipun, ada cara untuk membangun kurva ROC untuk lebih dari dua kelas, mereka kehilangan kesederhanaan kurva ROC untuk dua kelas. Selain itu, kurva ROC hanya dapat dibangun jika classifier pilihan menghasilkan beberapa jenis skor yang terkait dengan setiap prediksi. Misalnya, regresi logistik akan memberi Anda probabilitas untuk masing-masing dari dua kelas. Selain kesederhanaannya, kurva ROC memiliki keuntungan karena kurva tersebut tidak dipengaruhi oleh rasio antara instance berlabel positif dan negatif dalam kumpulan data Anda dan tidak memaksa Anda untuk memilih ambang. Namun demikian, disarankan untuk tidak hanya melihat kurva ROC saja tetapi juga visualisasi lainnya. Saya akan merekomendasikan melihat kurva presisi-ingat dan kurva biaya.satu pengukuran kesalahan sejati, mereka semua memiliki kekuatan dan kelemahan mereka.
Sastra yang saya temukan bermanfaat dalam hal ini adalah:
- Fawcett, T. (2006). Pengantar analisis ROC . Pattern Recognition Letters, 27 (8), 861–874.
- Drummond, C., & Holte, R. (2006). Kurva biaya: Metode yang ditingkatkan untuk memvisualisasikan kinerja classifier . Pembelajaran Mesin, 65 (1), 95-130
- Parker, C. (2011). Analisis Ukuran Kinerja untuk Pengklasifikasi Biner . 2011 IEEE 11 Konferensi Internasional tentang Penambangan Data (hlm. 517–526)
- Davis, J., & Goadrich, M. (2006). Hubungan antara Precision-Recall dan kurva ROC . Prosiding konferensi internasional ke-23 tentang pembelajaran Mesin (hlm. 233–240). New York, NY, AS: ACM
Jika pengklasifikasi Anda tidak memberikan semacam skor, Anda harus kembali ke langkah-langkah dasar yang dapat diperoleh dari matriks kebingungan yang berisi jumlah positif sejati, positif salah, negatif asli, dan negatif palsu. Visualisasi yang disebutkan di atas (ROC, presisi-recall, kurva biaya) semuanya didasarkan pada tabel-tabel ini yang diperoleh dengan menggunakan ambang batas yang berbeda dari skor classifier. Ukuran yang paling populer dalam hal ini mungkin adalah Ukuran-F1NN× NN 2 × 2SEBUAHSEBUAH