Saya memiliki data mentah yang memiliki sekitar 20 kolom (20 fitur). Sepuluh di antaranya merupakan data kontinu dan 10 di antaranya bersifat kategorikal. Beberapa data kategorikal dapat memiliki seperti 50 nilai yang berbeda (Amerika Serikat). Setelah saya pra-proses data, 10 kolom kontinu menjadi 10 kolom yang disiapkan dan 10 nilai kategorikal menjadi seperti 200 variabel disandikan satu-panas. Saya khawatir bahwa jika saya menempatkan semua 200 + 10 = 210 fitur ini ke dalam jaringan syaraf maka fitur 200-satu-panas (10 kolom kategori) akan benar-benar mendominasi fitur 10-kontinu.
Mungkin satu metode adalah untuk "mengelompokkan" kolom bersama atau sesuatu. Apakah ini masalah yang valid dan apakah ada cara standar untuk menangani masalah ini?
(Saya menggunakan Keras, meskipun saya pikir itu tidak terlalu penting.)