Saya sering mendengar tentang mengevaluasi kinerja model klasifikasi dengan mengulurkan set tes dan melatih model pada set pelatihan. Kemudian membuat 2 vektor, satu untuk nilai prediksi dan satu untuk nilai sebenarnya. Jelas melakukan perbandingan memungkinkan seseorang untuk menilai kinerja model dengan kekuatan prediktifnya menggunakan hal-hal seperti F-Score, Statistik Kappa, Precision & Recall, kurva ROC dll.
Bagaimana hal ini dibandingkan dengan mengevaluasi prediksi numerik seperti regresi? Saya akan berasumsi bahwa Anda bisa melatih model regresi pada set pelatihan, menggunakannya untuk memprediksi nilai, kemudian membandingkan nilai-nilai prediksi ini dengan nilai-nilai sebenarnya yang ada di set tes. Jelas ukuran kinerja harus berbeda karena ini bukan tugas klasifikasi. Residual biasa dan statistik adalah tindakan jelas, tetapi ada lebih / cara yang lebih baik untuk mengevaluasi kinerja untuk model regresi? Sepertinya klasifikasi memiliki begitu banyak pilihan tetapi regresi diserahkan kepada dan residu.