1
Mengurangi jumlah level variabel prediktor kategori tidak berurutan
Saya ingin melatih classifier, katakanlah SVM, atau forest acak, atau classifier lainnya. Salah satu fitur dalam dataset adalah variabel kategori dengan 1000 level. Apa cara terbaik untuk mengurangi jumlah level dalam variabel ini. Dalam R ada fungsi yang disebut combine.levels()dalam paket Hmisc , yang menggabungkan tingkat jarang, tetapi saya mencari …