Saya ingin membandingkan 2 pengklasifikasi yang berbeda untuk masalah klasifikasi teks multi-kelas yang menggunakan dataset pelatihan besar. Saya ragu apakah saya harus menggunakan kurva ROC atau kurva belajar untuk membandingkan 2 pengklasifikasi.
Di satu sisi, kurva pembelajaran berguna untuk menentukan ukuran dataset pelatihan, karena Anda dapat menemukan ukuran dataset di mana classifier berhenti belajar (dan mungkin menurun). Jadi pengklasifikasi terbaik dalam hal ini mungkin yang mencapai akurasi tertinggi dengan ukuran dataset terkecil.
Di sisi lain, kurva ROC memungkinkan Anda menemukan titik dengan trade-off yang tepat antara sensitivitas / spesifisitas. Pengklasifikasi terbaik dalam hal ini adalah yang paling dekat dengan bagian kiri atas, dengan TPR tertinggi untuk FPR apa pun.
Haruskah saya menggunakan kedua metode evaluasi? Apakah mungkin suatu metode dengan kurva belajar yang lebih baik memiliki kurva ROC yang lebih buruk, dan sebaliknya?