Saya tertarik pada pemilihan model dalam pengaturan deret waktu. Untuk konkret, anggaplah saya ingin memilih model ARMA dari kumpulan model ARMA dengan pesanan lag yang berbeda. Maksud utamanya adalah perkiraan .
Pemilihan model dapat dilakukan oleh
- validasi silang,
- penggunaan kriteria informasi (AIC, BIC),
antara metode lainnya.
Rob J. Hyndman menyediakan cara untuk melakukan validasi silang untuk deret waktu . Untuk sampel yang relatif kecil, ukuran sampel yang digunakan dalam validasi silang mungkin secara kualitatif berbeda dari ukuran sampel asli. Sebagai contoh, jika ukuran sampel asli adalah 200 pengamatan, maka orang bisa memikirkan memulai validasi silang dengan mengambil 101 pengamatan pertama dan memperluas jendela ke 102, 103, ..., 200 pengamatan untuk mendapatkan 100 hasil validasi silang. Jelas, model yang cukup pelit untuk 200 observasi mungkin terlalu besar untuk 100 pengamatan dan dengan demikian kesalahan validasinya akan besar. Jadi validasi silang cenderung secara sistematis mendukung model yang terlalu pelit. Ini adalah efek yang tidak diinginkan karena ketidakcocokan ukuran sampel .
Alternatif untuk validasi silang adalah menggunakan kriteria informasi untuk pemilihan model. Karena saya peduli tentang perkiraan, saya akan menggunakan AIC. Meskipun AIC secara asimtotik sama dengan meminimalkan perkiraan MSE satu langkah out-of-sample untuk model deret waktu (menurut posting ini oleh Rob J. Hyndman), saya ragu ini relevan di sini karena sampel ukuran yang saya pedulikan tidak sebesar itu ...
Pertanyaan: apakah saya harus memilih AIC dari validasi seri silang waktu untuk sampel kecil / menengah?
Beberapa pertanyaan terkait dapat ditemukan di sini , di sini dan di sini .