Pertanyaan yang sangat menarik, saya juga ingin tahu apa yang orang lain katakan. Saya seorang insinyur dengan pelatihan dan bukan ahli statistik, sehingga seseorang dapat memeriksa logika saya. Sebagai insinyur, kami ingin melakukan simulasi dan bereksperimen, jadi saya termotivasi untuk mensimulasikan dan menguji pertanyaan Anda.
Seperti yang ditunjukkan secara empiris di bawah ini, menggunakan variabel tren di ARIMAX meniadakan kebutuhan untuk membedakan dan membuat tren seri stasioner. Berikut adalah logika yang saya gunakan untuk memverifikasi.
- Simulasi proses AR
- Menambahkan tren deterministik
- Menggunakan ARIMAX dimodelkan dengan tren sebagai variabel eksogen seri di atas tanpa perbedaan.
- Memeriksa residu untuk white noise dan murni acak
Di bawah ini adalah kode R dan plot:
set.seed(3215)
##Simulate an AR process
x <- arima.sim(n = 63,list(ar = c(0.7)));
plot(x)
## Add Deterministic Trend to AR
t <- seq(1, 63)
beta <- 0.8
t_beta <- ts(t*beta,frequency=1)
ar_det <- x+t_beta
plot(ar_det)
## Check with arima
ar_model <- arima(ar_det,order=c(1,0,0),xreg=t,include.mean=FALSE)
## Check whether residuals of fitted model is random
pacf(ar_model$residuals)
AR (1) Plot Simulasi
AR (1) dengan tren deterministik
ARIMAX Residual PACF dengan tren sebagai eksogen. Residulasinya acak, tanpa pola yang tersisa
Seperti dapat dilihat di atas, pemodelan tren deterministik sebagai variabel eksogen dalam model ARIMAX meniadakan perlunya perbedaan. Setidaknya dalam kasus deterministik itu berhasil. Saya bertanya-tanya bagaimana ini akan berperilaku dengan tren stokastik yang sangat sulit diprediksi atau model.
Untuk menjawab pertanyaan kedua Anda, YA semua ARIMA termasuk ARIMAX harus dibuat diam. Setidaknya itulah yang dikatakan buku teks.
Selain itu, seperti yang dikomentari, lihat artikel ini . Penjelasan yang sangat jelas tentang Tren Deterministik vs. Tren Stochastic dan bagaimana cara menghapusnya untuk menjadikannya tren dan survei literatur yang sangat bagus tentang topik ini. Mereka menggunakannya dalam konteks jaringan saraf, tetapi berguna untuk masalah deret waktu umum. Rekomendasi akhir mereka adalah ketika itu jelas diidentifikasi sebagai tren deterministik, yang melakukan linear detrending, atau menerapkan pembedaan untuk membuat seri waktu stasioner. Juri masih di luar sana, tetapi sebagian besar peneliti yang dikutip dalam artikel ini merekomendasikan perbedaan sebagai lawan dari linear detrending.
Edit:
Di bawah ini adalah berjalan acak dengan proses stokastik melayang, menggunakan variabel eksogen dan arima perbedaan. Keduanya nampak memberikan jawaban yang sama dan pada intinya keduanya sama.
library(Hmisc)
set.seed(3215)
## ADD Stochastic Trend to simulated Arima this is AR(1) with unit root with non zero mean
y = rep(NA,63)
y[[1]] <- 2
for (i in 2:63) {
y[i] <-3+1*y[i-1]+ rnorm(1, mean = 0, sd = 1)
}
plot(y,type="l")
y_ts <- ts(y,frequency=1)
## Lag to create Xreg
y_1 <- Lag(y,shift=1)
## Start from 2 value to avoid NA and make it equal length with xreg
y <- window(y_ts,start =2,end=63)
xreg1 <- y_1[-1]
## Check the values with ARIMA and xreg
g <- arima(y,order=c(0,0,0),xreg=xreg1)
pacf(g$residuals)
## Check the values with ARIM
g1 <- arima(y,order=c(0,1,0))
pacf(g1$residuals)
##
ARIMA(0,0,0) with non-zero mean
Coefficients:
intercept xreg1
3.1304 0.9976
s.e. 0.2664 0.0025
Semoga ini membantu!