Data saya terdiri dari beberapa pengukuran kontinu dan beberapa variabel dummy mewakili tahun pengukuran telah dilakukan. Sekarang, saya ingin belajar jaringan saraf dengan data. Karena itu, saya zScore-menormalkan semua variabel, termasuk variabel dummy. Namun, saya bertanya-tanya apakah ini merupakan pendekatan yang masuk akal, karena normalisasi variabel dummy mengubah rentang mereka, yang saya kira membuat mereka kurang sebanding jika distribusinya berbeda. Di sisi lain, tidak menormalisasi variabel dummy juga mungkin dipertanyakan, karena tanpa normalisasi pengaruhnya terhadap jaringan mungkin tidak optimal.
Apa pendekatan terbaik untuk menangani variabel dummy, menormalkannya (zScore) atau membiarkannya seperti apa adanya?