Apakah mungkin untuk mengontrol biaya kesalahan klasifikasi dalam paket R randomForest ?
Dalam pekerjaan saya sendiri, negatif palsu (mis., Hilang karena kesalahan bahwa seseorang mungkin menderita penyakit) jauh lebih mahal daripada positif palsu. Paket rpart memungkinkan pengguna untuk mengontrol biaya kesalahan klasifikasi dengan menentukan matriks kerugian misclassifications berat badan berbeda. Apakah ada yang serupa untuk randomForest? Haruskah saya, misalnya, menggunakan classwtopsi untuk mengontrol kriteria Gini?
classwt: Ya, saya telah menemukan bahwa dalam praktiknya, dan sejalan dengan pengguna lain, hasilnya tidak seperti yang diharapkan. (iii)cutoff: Saya tidak jelas tentang cara memanfaatkancutoffdalam hal ini dan saya akan menerima saran lebih lanjut.