Implementasi randomForest tidak memungkinkan pengambilan sampel melebihi jumlah pengamatan, bahkan ketika pengambilan sampel dengan penggantian. Kenapa ini?
Bekerja dengan baik:
rf <- randomForest(Species ~ ., iris, sampsize=c(1, 1, 1), replace=TRUE)
rf <- randomForest(Species ~ ., iris, sampsize=3, replace=TRUE)
Apa yang ingin saya lakukan:
rf <- randomForest(Species ~ ., iris, sampsize=c(51, 1, 1), replace=TRUE)
Error in randomForest.default(m, y, ...) :
sampsize can not be larger than class frequency
Kesalahan serupa tanpa sampel bertingkat:
rf <- randomForest(Species ~ ., iris, sampsize=151, replace=TRUE)
Error in randomForest.default(m, y, ...) : sampsize too large
Karena saya mengharapkan metode untuk mengambil sampel bootstrap ketika diberi ganti = BENAR dalam kedua kasus, saya tidak mengharapkan batas ini.
Tujuan saya adalah untuk menggunakan ini dengan opsi pengambilan sampel bertingkat, untuk menarik sampel yang cukup besar dari kelas yang relatif jarang.