Pertanyaan: Saya ingin memastikan sesuatu, apakah penggunaan k-fold cross-validation dengan deret waktu sangat mudah, atau apakah orang perlu memberi perhatian khusus sebelum menggunakannya?
Latar Belakang: Saya memodelkan serangkaian waktu 6 tahun (dengan rantai semi-markov), dengan sampel data setiap 5 menit. Untuk membandingkan beberapa model, saya menggunakan validasi silang 6 kali lipat dengan memisahkan data dalam 6 tahun, jadi set pelatihan saya (untuk menghitung parameter) memiliki panjang 5 tahun, dan set tes memiliki panjang 1 tahun. Saya tidak memperhitungkan urutan waktu, jadi set saya yang berbeda adalah:
- lipat 1: pelatihan [1 2 3 4 5], ujian [6]
- lipat 2: pelatihan [1 2 3 4 6], ujian [5]
- lipat 3: pelatihan [1 2 3 5 6], ujian [4]
- lipat 4: pelatihan [1 2 4 5 6], ujian [3]
- lipat 5: pelatihan [1 3 4 5 6], ujian [2]
- lipat 6: pelatihan [2 3 4 5 6], ujian [1].
Saya membuat hipotesis bahwa setiap tahun tidak tergantung satu sama lain. Bagaimana saya bisa memverifikasi itu? Apakah ada referensi yang menunjukkan penerapan validasi silang k-fold dengan deret waktu.