Apakah mungkin untuk mengontrol biaya kesalahan klasifikasi dalam paket R randomForest ?
Dalam pekerjaan saya sendiri, negatif palsu (mis., Hilang karena kesalahan bahwa seseorang mungkin menderita penyakit) jauh lebih mahal daripada positif palsu. Paket rpart memungkinkan pengguna untuk mengontrol biaya kesalahan klasifikasi dengan menentukan matriks kerugian misclassifications berat badan berbeda. Apakah ada yang serupa untuk randomForest
? Haruskah saya, misalnya, menggunakan classwt
opsi untuk mengontrol kriteria Gini?
classwt
: Ya, saya telah menemukan bahwa dalam praktiknya, dan sejalan dengan pengguna lain, hasilnya tidak seperti yang diharapkan. (iii)cutoff
: Saya tidak jelas tentang cara memanfaatkancutoff
dalam hal ini dan saya akan menerima saran lebih lanjut.