Saya memasang model ARIMA pada seri waktu harian. Data dikumpulkan setiap hari dari 02-01-2010 hingga 30-07-2011 dan tentang penjualan surat kabar. Karena pola penjualan mingguan dapat ditemukan (jumlah rata-rata harian salinan yang terjual biasanya sama dari Senin hingga Jumat, kemudian meningkat pada hari Sabtu dan Minggu), saya mencoba menangkap "musiman" ini. Mengingat "data" data penjualan, saya membuat seri waktu sebagai berikut:
salests<-ts(data,start=c(2010,1),frequency=365)
dan kemudian saya menggunakan fungsi auto.arima (.) untuk memilih model ARIMA terbaik melalui kriteria AIC. Hasilnya selalu merupakan model ARIMA non-musiman, tetapi jika saya mencoba beberapa model SARIMA dengan sintaks berikut sebagai contoh:
sarima1<-arima(salests, order = c(2,1,2), seasonal = list(order = c(1, 0, 1), period = 7))
Saya bisa mendapatkan hasil yang lebih baik. Apakah ada kesalahan dalam spesifikasi perintah / arima ts? Pola mingguan sangat kuat sehingga saya tidak akan mengharapkan begitu banyak kesulitan dalam menangkapnya. Bantuan apa pun akan sangat berguna. Terima kasih, Giulia Deppieri
Memperbarui:
Saya sudah mengubah beberapa argumen. Lebih tepatnya, prosedur memilih ARIMA (4,1,3) sebagai model terbaik ketika saya atur D=7
, tetapi AIC dan yang lainnya yang baik dari indeks dan perkiraan kesesuaian juga) tidak membaik sama sekali. Saya kira ada beberapa kesalahan karena kebingungan antara musiman dan periodisitas ..?!
Panggilan auto.arima digunakan dan output diperoleh:
modArima<-auto.arima(salests,D=7,max.P = 5, max.Q = 5)
ARIMA(2,1,2) with drift : 1e+20
ARIMA(0,1,0) with drift : 5265.543
ARIMA(1,1,0) with drift : 5182.772
ARIMA(0,1,1) with drift : 1e+20
ARIMA(2,1,0) with drift : 5137.279
ARIMA(2,1,1) with drift : 1e+20
ARIMA(3,1,1) with drift : 1e+20
ARIMA(2,1,0) : 5135.382
ARIMA(1,1,0) : 5180.817
ARIMA(3,1,0) : 5117.714
ARIMA(3,1,1) : 1e+20
ARIMA(4,1,1) : 5045.236
ARIMA(4,1,1) with drift : 5040.53
ARIMA(5,1,1) with drift : 1e+20
ARIMA(4,1,0) with drift : 5112.614
ARIMA(4,1,2) with drift : 4953.417
ARIMA(5,1,3) with drift : 1e+20
ARIMA(4,1,2) : 4960.516
ARIMA(3,1,2) with drift : 1e+20
ARIMA(5,1,2) with drift : 1e+20
ARIMA(4,1,3) with drift : 4868.669
ARIMA(5,1,4) with drift : 1e+20
ARIMA(4,1,3) : 4870.92
ARIMA(3,1,3) with drift : 1e+20
ARIMA(4,1,4) with drift : 4874.095
Best model: ARIMA(4,1,3) with drift
Jadi saya menganggap fungsi arima harus digunakan sebagai:
bestOrder <- cbind(modArima$arma[1],modArima$arma[5],modArima$arma[2])
sarima1<-arima(salests, order = c(4,1,3))
tanpa parameter komponen musiman dan spesifikasi periode. Data dan analisis eksplorasi menunjukkan bahwa pola mingguan yang sama dapat dipertimbangkan secara proporsional untuk setiap minggu, dengan satu-satunya pengecualian Agustus 2010 (ketika peningkatan konsisten dalam penjualan terdaftar). Sayangnya saya tidak memiliki keahlian dalam pemodelan rentang waktu sama sekali, pada kenyataannya saya mencoba pendekatan ini untuk menemukan solusi alternatif untuk model parametrik dan non-parametrik lainnya yang saya coba cocokkan untuk data yang bermasalah ini. Saya juga memiliki banyak variabel numerik dependen, tetapi mereka menunjukkan daya yang rendah dalam menjelaskan variabel respons: tidak diragukan lagi, bagian yang paling sulit untuk dimodelkan adalah komponen waktu. Selain itu, konstruksi variabel dummy untuk mewakili bulan dan hari kerja ternyata tidak menjadi solusi yang kuat.