Saya tidak tahu apakah ini merupakan praktik umum / terbaik, tetapi ini merupakan sudut pandang lain dari masalah ini.
Jika Anda memiliki, katakanlah, tanggal, Anda dapat memperlakukan setiap bidang sebagai "variabel kategori" alih-alih "variabel kontinu". Hari akan memiliki nilai dalam set {1, 2 ..., 31}, bulan akan memiliki nilai dalam {1, ..., 12} dan, untuk tahun tersebut, Anda memilih nilai minimum dan maksimum dan membangun satu set.
Kemudian, karena nilai numerik tertentu dari hari, bulan, dan tahun mungkin tidak berguna untuk menemukan tren dalam data, gunakan representasi biner untuk menyandikan nilai numerik, karena masing-masing bit merupakan fitur. Misalnya, bulan 5 akan menjadi 0 0 0 0 1 0 0 0 0 0 0 0
(11 0 dan 1 di posisi 5, setiap bit menjadi fitur).
Jadi, setelah, misalnya, 10 tahun dalam "tahun set", tanggal akan diubah menjadi vektor 43 fitur (= 31 + 12 + 10). Menggunakan "vektor jarang", jumlah fitur seharusnya tidak menjadi masalah.
Hal serupa dapat dilakukan untuk data waktu, hari dalam seminggu, hari dalam sebulan ...
Itu semua tergantung dari pertanyaan yang Anda ingin model mesin pembelajaran Anda untuk menjawab.