Bagaimana cara memberi bobot lebih pada pengamatan terbaru di R?
Saya menganggap ini sebagai pertanyaan atau keinginan yang umum diajukan, tetapi saya memiliki kesulitan untuk mencari tahu bagaimana menerapkannya. Saya telah mencoba mencari banyak untuk ini tetapi saya tidak dapat menemukan contoh praktis yang baik.
Dalam contoh saya, saya akan memiliki dataset besar dari waktu ke waktu. Saya ingin mengatakan menerapkan semacam pembobotan eksponensial dari baris data yang lebih baru. Jadi saya akan memiliki semacam fungsi eksponensial yang mengatakan pengamatan pada 2015 ___ lebih penting untuk melatih model daripada pengamatan pada 2012.
Variabel dataset saya berisi campuran nilai kategoris dan numerik dan target saya adalah nilai numerik - jika itu penting.
Saya ingin menguji / mencoba menggunakan model seperti GBM / Random Forest, idealnya dalam paket CARET.
pembaruan-pertanyaan
Saya menghargai tanggapan yang diberikan di bawah ini tentang bagaimana cara membusuk secara eksponensial dengan jarak tanggal antara dua titik.
Namun, ketika datang untuk melatih model ini dalam caret, bagaimana sebenarnya faktor bobot? Nilai bobot di setiap baris pelatihan adalah jarak antara beberapa titik di masa depan dan saat titik itu terjadi secara historis.
Apakah bobot hanya berperan selama prediksi? Karena jika mereka ikut bermain selama pelatihan, bukankah itu akan menyebabkan berbagai masalah karena berbagai lipatan silang akan memiliki bobot yang berbeda-beda, mencoba memprediksi sesuatu yang mungkin benar-benar ada pada titik waktu sebelumnya?