Saya mencoba membuat prediksi menggunakan model hutan acak di R.
Namun saya mendapatkan kesalahan karena beberapa faktor memiliki nilai yang berbeda di set tes daripada di set pelatihan. Misalnya, suatu faktor Cat_2
memiliki nilai 34, 68, 76
, dll., Di set tes yang tidak muncul di set pelatihan. Sayangnya, saya tidak memiliki kendali atas set Tes ... Saya harus menggunakannya apa adanya.
Solusi saya satu-satunya adalah mengubah faktor yang bermasalah kembali ke nilai numerik, menggunakan as.numeric()
. Ini berfungsi tetapi saya tidak begitu puas, karena nilai-nilai ini adalah kode yang tidak memiliki arti numerik ...
Apakah Anda pikir akan ada solusi lain, untuk menjatuhkan nilai-nilai baru dari set tes? Tetapi tanpa menghapus semua nilai faktor lainnya (katakanlah nilai 1, 2, 14, 32
, dll.) Yang ada dalam pelatihan dan tes, dan berisi informasi yang berpotensi berguna untuk prediksi.