Pertanyaan ini bisa di sini atau di SO mungkin ...
Misalkan set data pelatihan Anda berisi data kategorikal dan berkelanjutan seperti pengaturan ini:
Animal, breed, sex, age, weight, blood_pressure, annual_cost
cat, calico, M, 10, 15 , 100 , 100
cat, tabby, F, 5, 10 , 80 , 200
dog, beagle, M, 3, 30 , 90 , 200
dog, lab, F, 8, 75 , 80 , 100
Dan variabel dependen yang akan diprediksi adalah biaya dokter hewan tahunan. Saya agak bingung dengan teknik spesifik yang tersedia untuk menangani dataset seperti itu. Apa metode yang biasa digunakan untuk menangani dataset yang merupakan campuran data kontinu dan kategorikal?