AIC sering direkomendasikan sebagai kriteria untuk membandingkan model untuk peramalan seri waktu. Lihat misalnya ini dalam konteks model regresi dinamis :
AIC dapat dihitung untuk model akhir, dan nilai ini dapat digunakan untuk menentukan prediktor terbaik. Artinya, prosedur harus diulangi untuk mempertimbangkan semua himpunan bagian prediktor, dan model dengan nilai AICc terendah yang dipilih.
Mengapa tidak membandingkan model berdasarkan kinerja out-of-sample mereka? (mis. pilih model dengan SSE terendah dalam prakiraan out-of-sample). Saya telah membaca beberapa buku pelajaran dan situs web tentang perkiraan seri waktu dan belum menemukan diskusi ini. Yang paling dekat dengan saya adalah entri blog ini tentang Fakta dan kekeliruan AIC :
AIC sebenarnya bukan ukuran "dalam sampel". Ya, itu dihitung menggunakan data pelatihan. Tetapi asimtotik, meminimalkan AIC setara dengan meminimalkan MSE validasi silang keluar-keluar untuk data cross-sectional, dan setara dengan meminimalkan MSE perkiraan satu langkah out-of-sample untuk model deret waktu. Properti ini yang menjadikannya kriteria yang sangat menarik untuk digunakan dalam memilih model untuk perkiraan.
Dalam contoh saya telah bekerja (tidak dapat memposting plot di sini, meskipun; Saya perlu lebih banyak reputasi di situs ini), saya mencoba kedua pendekatan dan sebagian besar waktu AIC dan out-of-sample SSE tidak menghasilkan yang sama hasil. Prosedur yang saya gunakan adalah sebagai berikut:
- Saya membagi data dalam pelatihan dan sampel uji (pada titik arbitrer; pertanyaan tentang ini di bawah)
- Saya memperkirakan model yang bersaing (ARIMA dengan regressor eksternal, mengubah parameter ARIMA dan regressor) menggunakan sampel pelatihan (230 periode pertama; semua model memiliki jumlah pengamatan yang sama sehingga AIC sebanding).
- Kemudian, saya memperkirakan seri untuk periode yang sama dengan sampel uji (periode 231-260).
- Untuk setiap model, saya menghitung SSE sederhana seperti mana adalah nilai yang diamati dari seri (sampel uji) dan adalah nilai yang diramalkan oleh model.
- Saya membandingkan model yang ditunjukkan oleh AIC (dihitung menggunakan data pelatihan) dengan model dengan SSE out-of-sample terendah. Sebagian besar waktu model yang dipilih berbeda (dan setidaknya secara visual, yang dipilih oleh SSE berkinerja lebih baik).
Jika seseorang dapat menjelaskan kepada saya apa yang terjadi di balik ini saya akan sangat berterima kasih. Saya jelas bukan ahli dalam hal ini. Saya hanya mencoba sedikit belajar sendiri, jadi mohon maaf jika saya mengabaikan sesuatu yang penting dalam buku teks yang saya baca.
Akhirnya, sebuah pertanyaan tentang pemisahan data dalam pelatihan dan sampel uji untuk deret waktu. Menurut saya ada sesuatu yang secara fundamental berbeda dari menggunakan prosedur yang sama untuk data cross sectional. Untuk data cross sectional Anda dapat mengambil dua sampel acak dari seluruh dataset Anda. Untuk deret waktu ini tidak masuk akal. Jadi, Anda perlu mengambil titik sewenang-wenang untuk membagi seri dalam pelatihan dan sampel uji. Masalahnya adalah bahwa biasanya model terbaik berbeda untuk setiap titik arbitrer. Mungkin itu sebabnya pendekatan ini sepertinya tidak sering digunakan. Apakah ini alasan mengapa AIC lebih disukai untuk pemilihan model? (Mengingat bahwa "tanpa gejala, meminimalkan AIC adalah ... setara dengan meminimalkan perkiraan satu langkah MSE untuk model seri waktu").)