Saya memiliki seri waktu harian yang cukup dapat diprediksi dengan musiman mingguan. Saya dapat membuat prediksi yang tampaknya cukup akurat (dikonfirmasi oleh validasi silang) ketika tidak ada hari libur. Namun, ketika ada hari libur, saya memiliki masalah berikut:
- Saya mendapatkan angka bukan nol untuk liburan dalam perkiraan saya, meskipun semua liburan historis adalah 0. Ini sebenarnya bukan masalah utama. Masalahnya adalah ...
- Karena pemrosesan yang tidak terjadi pada hari libur "tumpah" ke hari-hari setelah liburan, variabel dummy sederhana tidak memotongnya, karena pencilan ini tampaknya bersifat inovasi jangka pendek. Jika tidak ada musiman mingguan, saya mungkin bisa membuat perkiraan untuk mendistribusikan data yang belum diproses pada hari libur selama lima hari atau lebih setelah liburan (seperti yang disarankan dalam Bagaimana Anda membuat variabel yang mencerminkan dampak utama dan keterlambatan liburan / efek kalender dalam analisis deret waktu? ). Namun, distribusi "limpahan" tergantung pada hari di mana liburan terjadi, dan apakah liburan itu Natal atau Thanksgiving, di mana pesanan ditempatkan pada tingkat yang lebih rendah daripada sisa tahun ini.
Berikut adalah beberapa potret dari validasi silang saya yang menunjukkan hasil yang diprediksi (biru) vs hasil (merah) yang sebenarnya untuk liburan yang muncul pada hari yang berbeda dalam seminggu:
Saya juga khawatir bahwa dampak Natal tergantung pada hari minggu itu jatuh, dan saya hanya memiliki enam atau lebih tahun data historis.
Apakah ada yang punya saran untuk bagaimana menghadapi jenis outlier inovasi dalam konteks perkiraan? (Sayangnya saya tidak bisa membagikan data apa pun)