Meramalkan seri waktu non-stasioner

Saya ingin meramalkan deret waktu non-stasioner, yang melibatkan beberapa asumsi a-priori penting setelah mempelajari contoh-contoh deret tersebut.

Saya telah membangun fungsi distribusi probabilitas satu titik rata-rata waktu yang diperkirakan oleh distribusi normal. Dari sudut pandang ini, saya ingin perkiraan tidak melebihi ini ketika . Dengan kata lain, varian harus dibatasi.
$\hat{hal} (x) = \frac{1}{\sqrt{2 π σ_{\infty}^{2}}} \exp (- \frac{x^{2}}{2 σ_{\infty}^{2}})$ $\hat p(x) = \frac{1}{\sqrt{2\pi \sigma^2_{\infty}}} \exp\left(-\frac{x^2}{2\sigma^2_{\infty}}\right)$ $z_t(l)$ $l \to \infty$ $z_t(l)$
Fungsi distribusi probabilitas dua titik rata-rata juga telah dibangun, yang mengarah pada identifikasi fungsi autokorelasi. tersedia . $\hat p(x_i,i;x_j,j)$ $\rho(j) \approx A j^{-\alpha}$ $0<\alpha<0.5$

Pada awalnya, proses identifikasi Box-Jenkins membawa saya ke model $ARIMA(0,1,3)$

Saya tidak dapat membatasi varians sampai (yang mengikuti dari persamaan untuk bobot BJ ). Pada saat yang sama, saya tidak dapat menggunakan karena autokorelasi awal menurun secara perlahan (yang mungkin merupakan bukti non-stasioneritas menurut BJ). Ini adalah kendala utama bagi saya. $d \ne 0$ $\psi_j$ $d=0$
Secara visual, simulasi tidak sesuai dengan perilaku sampel saya. Dan korelasi dari perbedaan pertama dari seri berada dalam perjanjian yang buruk dengan korelasi berikut dari model. $ARIMA(0,1,3)$
Analisis residu menunjukkan korelasi yang signifikan mulai lag 3. Inilah sebabnya mengapa pernyataan awal saya tentang salah. $ARIMA(0,1,3)$

Mencoba menyesuaikan model yang berbeda, saya melihat bahwa ada korelasi residu yang signifikan dekat dengan lag untuk setiap . Dapat berasumsi bahwa saya memerlukan model (sebagai pilihan pembatas), misalnya ARIMA fraksional. $ARIMA(p,0,0)$ $p$ $p$ $ARIMA(\infty,0,q)$

Dari [1] Saya telah belajar tentang Pecahan $ARIMA(p,d,q)$ model yang $ARIMA(\infty,0,q)$ berlaku.

Saya belum menemukan paket GNU R dengan dukungan nilai yang hilang untuk ini. Nilai-nilai yang hilang tampaknya menjadi semacam tantangan.
Publikasi pada ARIMA fraksional sangat jarang. Apakah model pecahan seperti itu benar-benar digunakan? Mungkin ada pengganti model ARIMA yang baik untuk kebutuhan saya? Peramalan bukan utama saya, saya hanya memiliki minat pragmatis.
Dari literatur yang berbeda (misalnya [2]), saya belajar bahwa secara praktis tidak mungkin untuk memutuskan antara ARIMA fraksional dan model dengan "pergeseran level". Namun, saya belum menemukan paket untuk GNU R agar sesuai dengan model 'level shift'.

_{[1]: Granger, Joyeux .: J. of time series anal. vol. 1 no. 1 1980, p.15}

[2]: Grassi, de Magistris .: "Ketika memori lama memenuhi filter Kalman: Sebuah studi perbandingan", Statistik Komputasi dan Analisis Data, 2012, di media cetak.

Pembaruan: untuk membuat kemajuan saya sendiri dan untuk menjawab @IrishStat

Pernyataan saya tentang distribusi probabilitas dua titik secara umum tidak benar. Fungsi yang dibangun dengan cara ini akan tergantung pada panjang seri penuh. Jadi, ada sedikit yang bisa diekstrak dari ini. Setidaknya, parameter bernama $\alpha$ akan tergantung pada panjang seri penuh.

Daftar 2 dan 3 juga telah diperbarui.

Data saya tersedia sebagai file dat di sini .

Saat ini, saya ragu antara FARIMA dan level shift, dan saya masih tidak dapat menemukan perangkat lunak yang sesuai untuk memeriksa opsi ini. Ini juga pengalaman pertama saya dengan identifikasi model, sehingga bantuan apa pun akan dihargai.

time-series forecasting arima

— 0x2207
sumber

Saya sedikit bingung dengan data Anda. Misalnya apa arti dari 6325,76 ... dan -.247831. Apa yang diamati? Apakah data kronologis dan spasi waktu yang sama? 6325,76666666667 -,247831949032426 "770" 6326,78333333333 ,0282060159445925 "771" 6327,78333333333 ,162348034962085 "772" 6328,78333333333 -,206057978534193 "773" 6329,78333333333 -,427928912063427 "774" 6330,78333333333 NA "775" 6331,78333333333 NA "776" 6332,78333333333 NA "777" 6333,78333333333 NA "778" 6334,78333333333 NA

— IrishStat

Ini adalah hasil write.table (). Kolom pertama adalah "nama baris" (tidak berarti), kedua adalah momen waktu, nilai ketiga. Mereka hampir sama pengamatan jaraknya, banyak data yang terlewatkan.

— 0x2207

Pendekatan domain waktu membutuhkan data dengan spasi yang sama tanpa nilai yang hilang. Untuk tujuan pedagogis, saya akan mengambil bagian dari data DAN menganggap bahwa itu sama spasi dan mencoba untuk mengkarakterisasi itu.

— IrishStat

Saya belum pernah melihat model seperti proses identifikasi Box-Jenkins membawa saya ke ARIMA (0,1,3) model TETAPI saya belum pernah melihat angsa hitam sampai saya pergi ke Australia. Silakan kirim data Anda karena mungkin menyarankan perlunya

Deteksi Intervensi yang mengarah ke termasuk pergeseran level, tren waktu setempat, dkk
Parameter waktu bervariasi
Varians kesalahan waktu yang bervariasi

Jika data Anda bersifat rahasia, cukup skala itu.

OK setelah menerima data Anda (sekitar 80000 bacaan), saya memilih 805 pengamatan mulai dari titik 6287 dan diperoleh.

masukkan deskripsi gambar di sini . Titik perubahan signifikan terdeteksi pada periode 137 menunjukkan parameter yang bervariasi waktu. 668 pengamatan yang tersisa menunjukkan Model ARIMA pdq (3,0,0) dengan level.step shift mendukung kesimpulan awal Anda tentang lag 3 .. Grafik Aktual / Fit / Prakiraan adalah masukkan deskripsi gambar di sini The Residual Plot dan acf dari residual adalah . Karena acf dari residu menunjukkan struktur yang kuat pada periode 5 dan 10, Anda dapat menyelidiki lebih lanjut struktur musiman pada lag 5. Saya harap ini membantu.

— IrishStat
sumber