Saya ingin meramalkan deret waktu non-stasioner, yang melibatkan beberapa asumsi a-priori penting setelah mempelajari contoh-contoh deret tersebut.
Saya telah membangun fungsi distribusi probabilitas satu titik rata-rata waktu yang diperkirakan oleh distribusi normal. Dari sudut pandang ini, saya ingin perkiraan tidak melebihi ini ketika . Dengan kata lain, varian harus dibatasi.
Fungsi distribusi probabilitas dua titik rata-rata juga telah dibangun, yang mengarah pada identifikasi fungsi autokorelasi. tersedia .
Pada awalnya, proses identifikasi Box-Jenkins membawa saya ke model
Saya tidak dapat membatasi varians sampai (yang mengikuti dari persamaan untuk bobot BJ ). Pada saat yang sama, saya tidak dapat menggunakan karena autokorelasi awal menurun secara perlahan (yang mungkin merupakan bukti non-stasioneritas menurut BJ). Ini adalah kendala utama bagi saya.
Secara visual, simulasi tidak sesuai dengan perilaku sampel saya. Dan korelasi dari perbedaan pertama dari seri berada dalam perjanjian yang buruk dengan korelasi berikut dari model.
Analisis residu menunjukkan korelasi yang signifikan mulai lag 3. Inilah sebabnya mengapa pernyataan awal saya tentang salah.
Mencoba menyesuaikan model yang berbeda, saya melihat bahwa ada korelasi residu yang signifikan dekat dengan lag untuk setiap . Dapat berasumsi bahwa saya memerlukan model (sebagai pilihan pembatas), misalnya ARIMA fraksional.
Dari [1] Saya telah belajar tentang Pecahan model yang berlaku.
Saya belum menemukan paket GNU R dengan dukungan nilai yang hilang untuk ini. Nilai-nilai yang hilang tampaknya menjadi semacam tantangan.
Publikasi pada ARIMA fraksional sangat jarang. Apakah model pecahan seperti itu benar-benar digunakan? Mungkin ada pengganti model ARIMA yang baik untuk kebutuhan saya? Peramalan bukan utama saya, saya hanya memiliki minat pragmatis.
Dari literatur yang berbeda (misalnya [2]), saya belajar bahwa secara praktis tidak mungkin untuk memutuskan antara ARIMA fraksional dan model dengan "pergeseran level". Namun, saya belum menemukan paket untuk GNU R agar sesuai dengan model 'level shift'.
[1]: Granger, Joyeux .: J. of time series anal. vol. 1 no. 1 1980, p.15
[2]: Grassi, de Magistris .: "Ketika memori lama memenuhi filter Kalman: Sebuah studi perbandingan", Statistik Komputasi dan Analisis Data, 2012, di media cetak.
Pembaruan: untuk membuat kemajuan saya sendiri dan untuk menjawab @IrishStat
Pernyataan saya tentang distribusi probabilitas dua titik secara umum tidak benar. Fungsi yang dibangun dengan cara ini akan tergantung pada panjang seri penuh. Jadi, ada sedikit yang bisa diekstrak dari ini. Setidaknya, parameter bernama akan tergantung pada panjang seri penuh.
Daftar 2 dan 3 juga telah diperbarui.
Data saya tersedia sebagai file dat di sini .
Saat ini, saya ragu antara FARIMA dan level shift, dan saya masih tidak dapat menemukan perangkat lunak yang sesuai untuk memeriksa opsi ini. Ini juga pengalaman pertama saya dengan identifikasi model, sehingga bantuan apa pun akan dihargai.