Saya memiliki data penjualan bersejarah dari toko roti (setiap hari, lebih dari 3 tahun). Sekarang saya ingin membuat model untuk memprediksi penjualan di masa depan (menggunakan fitur seperti hari kerja, variabel cuaca, dll.).
Bagaimana saya harus membagi dataset untuk pemasangan dan evaluasi model?
- Apakah perlu kronologis kereta / validasi / ujian split?
- Apakah saya kemudian akan melakukan penyetelan hyperparameter dengan set kereta dan validasi?
- Apakah validasi silang (bersarang) merupakan strategi yang buruk untuk masalah deret waktu?
EDIT
Berikut adalah beberapa tautan yang saya temui setelah mengikuti URL yang disarankan oleh @ ene100:
- Rob Hyndman menjelaskan "asal usul peramalan bergulir" dalam teori dan dalam praktik (dengan kode R)
- istilah lain untuk bergulir perkiraan asal adalah "berjalan maju optimasi" (di sini atau di sini ), "bergulir cakrawala" atau "bergerak asal"
- tampaknya teknik ini tidak akan diintegrasikan ke dalam scikit-learning dalam waktu dekat, karena "permintaan dan seminalitas teknik ini tidak jelas" (dinyatakan di sini ).
Dan ini adalah saran lain untuk validasi silang time-series.