Saya memiliki masalah klasifikasi dengan data kategorikal dan numerik. Masalah yang saya hadapi adalah bahwa data kategorikal saya tidak diperbaiki, itu berarti bahwa kandidat baru yang labelnya ingin saya prediksi mungkin memiliki kategori baru yang tidak diamati sebelumnya.
Misalnya, jika data kategorikal saya adalah sex
, satu-satunya label yang mungkin adalah female
, male
dan other
, apa pun yang terjadi. Namun, variabel kategorikal saya adalah city
agar bisa terjadi bahwa orang yang saya coba prediksi memiliki kota baru yang belum pernah dilihat oleh pengklasifikasi saya.
Saya bertanya-tanya apakah ada cara untuk melakukan klasifikasi dalam istilah ini atau apakah saya harus melakukan pelatihan lagi mengingat data kategorikal baru ini.
city
ke nomor berdasarkan beberapa fungsi? Seperticity' = f(latitude, longitude)
itu, Anda dapat membuat nilai baru untuk kota mana pun