Kedua akar-mean-Square-Kesalahan (RMSE) dan koefisien determinasi ( )R2 menawarkan yang berbeda, namun saling melengkapi, informasi yang harus dinilai ketika mengevaluasi model yang fisik Anda. Tidak ada yang "lebih baik", tetapi beberapa laporan mungkin lebih fokus pada satu metrik tergantung pada aplikasi tertentu.
Saya akan menggunakan yang berikut ini sebagai panduan yang sangat umum untuk memahami perbedaan antara kedua metrik:
The RMSE memberi Anda rasa seberapa dekat (atau jauh) nilai-nilai Anda diprediksi berasal dari data aktual Anda sedang berusaha untuk Model. Ini berguna dalam berbagai aplikasi di mana Anda ingin memahami keakuratan dan ketepatan prediksi model Anda (misalnya, memodelkan tinggi pohon).
Pro
- Ini relatif mudah untuk dipahami dan dikomunikasikan karena nilai yang dilaporkan berada dalam unit yang sama dengan variabel dependen yang dimodelkan.
Cons
- Ini sensitif terhadap kesalahan besar (menghukum kesalahan prediksi besar lebih dari kesalahan prediksi yang lebih kecil).
R2
Pro
- Memberi pengertian menyeluruh tentang seberapa baik variabel yang Anda pilih cocok dengan data.
Cons
- R2R2
Tentu saja, di atas akan tunduk pada ukuran sampel dan desain pengambilan sampel, dan pemahaman umum bahwa korelasi tidak menyiratkan sebab-akibat.
This value shows how well future outcomes can be predicted by the model
- ini sangat menyesatkan dan condong ke arah yang salah . Tidak ada jaminan bahwa koefisien determinasi yang tinggi dalam model yang diberikan berkaitan dengan seberapa baik hasil di masa mendatang akan diprediksi.