Saya sedang melatih model klasifikasi dengan Random Forest untuk membedakan antara 6 kategori. Data transaksional saya memiliki sekitar 60k + pengamatan dan 35 variabel. Berikut adalah contoh bagaimana kira-kira terlihat.
_________________________________________________
|user_id|acquisition_date|x_var_1|x_var_2| y_vay |
|-------|----------------|-------|-------|--------|
|111 | 2013-04-01 | 12 | US | group1 |
|222 | 2013-04-12 | 6 | PNG | group1 |
|333 | 2013-05-05 | 30 | DE | group2 |
|444 | 2013-05-10 | 78 | US | group3 |
|555 | 2013-06-15 | 15 | BR | group1 |
|666 | 2013-06-15 | 237 | FR | group6 |
Setelah model dibuat, saya ingin membuat skor pengamatan dari beberapa minggu terakhir. Karena ada perubahan pada sistem, pengamatan yang lebih baru akan lebih mirip dengan lingkungan pengamatan saat ini yang ingin saya prediksi. Oleh karena itu, saya ingin membuat variabel bobot sehingga Hutan Acak akan lebih mementingkan pengamatan baru-baru ini.
Apakah ada yang tahu jika paket randomForest di R mampu menangani bobot per pengamatan?
Bisakah Anda menyarankan metode apa yang baik untuk membuat variabel bobot? Misalnya, karena data saya dari tahun 2013, saya berpikir bahwa saya dapat mengambil angka bulan dari tanggal sebagai berat. Adakah yang melihat masalah dengan metode ini?
Banyak terima kasih sebelumnya!