Saya benar-benar berpikir ini adalah pertanyaan yang bagus dan pantas dijawab. Tautan yang disediakan ditulis oleh seorang psikolog yang mengklaim bahwa beberapa metode buatan sendiri adalah cara yang lebih baik untuk melakukan analisis deret waktu daripada Box-Jenkins. Saya berharap bahwa usaha saya pada jawaban akan mendorong orang lain, yang lebih berpengetahuan tentang rangkaian waktu, untuk berkontribusi.
Dari perkenalannya, sepertinya Darlington memperjuangkan pendekatan pas model AR dengan kuadrat-terkecil. Yaitu, jika Anda ingin mencocokkan model
ke deret waktu , Anda bisa mundur seri pada seri dengan lag , lag , dan seterusnya hingga lag , menggunakan regresi berganda biasa. Ini tentu saja diizinkan; di R, itu bahkan merupakan opsi dalam fungsi. Saya mengujinya, dan cenderung memberikan jawaban yang mirip dengan metode default untuk pemasangan model AR di R.z t z t 1 2 k
zt= α1zt - 1+ ⋯ + αkzt - k+ εt
ztzt12kar
Dia juga menganjurkan regresi pada hal-hal seperti atau kekuatan untuk menemukan tren. Sekali lagi, ini baik-baik saja. Banyak buku seri waktu membahas ini, misalnya Shumway-Stoffer dan Cowpertwait-Metcalfe. Biasanya, analisis deret waktu dapat dilanjutkan di sepanjang baris berikut: Anda menemukan tren, menghapusnya, lalu menyesuaikan model dengan residu. t tzttt
Tapi sepertinya dia juga mengadvokasi over-fitting dan kemudian menggunakan pengurangan dalam mean-squared error antara seri pas dan data sebagai bukti bahwa metodenya lebih baik. Sebagai contoh:
Saya merasa korelogram sekarang sudah usang. Tujuan utama mereka adalah untuk memungkinkan para pekerja menebak model mana yang paling cocok dengan data, tetapi kecepatan komputer modern (setidaknya dalam regresi jika tidak sesuai dengan model time-series) memungkinkan pekerja untuk hanya memasukkan beberapa model dan melihat dengan tepat bagaimana masing-masing cocok seperti yang diukur dengan mean squared error. [Masalah kapitalisasi secara kebetulan tidak relevan dengan pilihan ini, karena kedua metode ini sama-sama rentan terhadap masalah ini.]
Ini bukan ide yang baik karena tes model seharusnya seberapa baik dapat diperkirakan, bukan seberapa baik itu cocok dengan data yang ada. Dalam tiga contohnya, ia menggunakan "kesalahan akar kuadrat yang disesuaikan" sebagai kriteria untuk kualitas kecocokan. Tentu saja, pemasangan model yang berlebihan akan membuat estimasi kesalahan sampel yang lebih kecil, sehingga klaimnya bahwa modelnya "lebih baik" karena mereka memiliki RMSE yang lebih kecil salah.
Singkatnya, karena dia menggunakan kriteria yang salah untuk menilai seberapa baik model, dia mencapai kesimpulan yang salah tentang regresi vs ARIMA. Saya berani bertaruh bahwa, jika dia menguji kemampuan prediksi model sebagai gantinya, ARIMA akan keluar di atas. Mungkin seseorang dapat mencobanya jika mereka memiliki akses ke buku yang ia sebutkan di sini .
[Tambahan: untuk lebih lanjut tentang ide regresi, Anda mungkin ingin memeriksa buku seri waktu yang lebih lama yang ditulis sebelum ARIMA menjadi yang paling populer. Sebagai contoh, Kendall, Time-Series , 1973, Bab 11 memiliki seluruh bab tentang metode ini dan perbandingan dengan ARIMA.]