Saat ini saya sedang mengerjakan proyek untuk melakukan peramalan data deret waktu (data bulanan). Saya menggunakan R untuk melakukan peramalan. Saya memiliki 1 variabel dependen (y) dan 3 variabel independen (x1, x2, x3). Variabel y memiliki 73 pengamatan, dan begitu pula 3 variabel lainnya (juga 73). Dari Januari 2009 hingga Januari 2015. Saya telah memeriksa korelasi dan p-value, dan itu semua penting untuk dimasukkan ke dalam model. Pertanyaan saya adalah: Bagaimana saya bisa membuat prediksi yang baik menggunakan semua variabel independen? Saya tidak memiliki nilai mendatang untuk variabel-variabel ini. Katakanlah saya ingin memprediksi apa variabel y saya dalam lebih dari 2 tahun (pada 2017). Bagaimana saya bisa melakukan ini?
Saya mencoba kode berikut:
model = arima(y, order(0,2,0), xreg = externaldata)
Bisakah saya melakukan prediksi nilai y lebih dari 2 tahun dengan kode ini?
Saya juga mencoba kode regresi:
reg = lm(y ~ x1 + x2 + x3)
Tetapi bagaimana saya meluangkan waktu dalam kode ini? Bagaimana saya bisa meramalkan berapa nilai y saya akan berakhir katakanlah 2 tahun? Saya baru mengenal statistik dan perkiraan. Saya telah melakukan beberapa pembacaan dan cam melintasi nilai lag, tetapi bagaimana saya bisa menggunakan nilai lag dalam model untuk melakukan peramalan?
Sebenarnya pertanyaan saya secara keseluruhan adalah bagaimana saya bisa meramalkan data deret waktu dengan variabel eksternal tanpa nilai masa depan?