Stasioneritas urutan kedua lebih lemah dari stasioneritas ketat. Stasioneritas orde kedua mensyaratkan bahwa momen orde pertama dan kedua (rerata, varians, dan kovarian) konstan sepanjang waktu dan, karenanya, tidak bergantung pada waktu di mana proses diamati. Secara khusus, seperti yang Anda katakan, kovarians hanya bergantung pada urutan lag, , tetapi tidak pada waktu pengukurannya, untuk semua .C o v ( x t , x t - k ) = C o v ( x t + h , x t + h - k ) tkCo v ( xt, xt - k) = Co v ( xt + h, xt + h - k)t
Dalam proses stasioneritas yang ketat, momen semua pesanan tetap konstan sepanjang waktu, yaitu, seperti yang Anda katakan, distribusi gabungan sama dengan sambungan distribusi untuk semua dan . X t 1 + k + X t 2 + k + . . . + X t m + k t 1 , t 2 , . . . , t m kXt 1, Xt 2, . . . , Xt mXt 1 + k+ Xt 2 + k+ . . . + Xt m + kt 1 , t 2 , . . . , t mk
Oleh karena itu, stasioneritas yang ketat melibatkan stasioneritas urutan kedua tetapi sebaliknya tidak benar.
Edit (diedit sebagai jawaban atas komentar @ whuber)
Pernyataan sebelumnya adalah pemahaman umum tentang stasioneritas yang lemah dan kuat. Meskipun gagasan bahwa stasioneritas dalam pengertian yang lemah tidak menyiratkan stasioneritas dalam arti yang lebih kuat mungkin setuju dengan intuisi, mungkin tidak begitu mudah untuk dibuktikan, seperti yang ditunjukkan oleh whuber dalam komentar di bawah ini. Akan sangat membantu untuk menggambarkan ide seperti yang disarankan dalam komentar itu.
Bagaimana kita dapat mendefinisikan suatu proses yang stasioner tingkat kedua (rerata, varians, dan konstanta kovarian sepanjang waktu) tetapi tidak stasioner dalam arti yang ketat (momen-momen orde yang lebih tinggi tergantung pada waktu)?
Seperti yang disarankan oleh @whuber (jika saya mengerti dengan benar) kita dapat menggabungkan kumpulan pengamatan yang berasal dari distribusi yang berbeda. Kita hanya perlu berhati-hati bahwa distribusi tersebut memiliki mean dan varians yang sama (pada titik ini mari kita pertimbangkan bahwa mereka disampel secara independen satu sama lain). Di satu sisi, Kita misalnya dapat menghasilkan pengamatan dari distribusi Student dengan derajat kebebasan. Mean adalah nol dan variansnya adalah . Di sisi lain, kita dapat mengambil distribusi Gaussian dengan mean nol dan varian .5 5 / ( 5 - 2 ) = 5 / 3 5 / 3t55 / ( 5 - 2 ) = 5 / 35 / 3
Kedua distribusi memiliki mean yang sama (nol) dan varians ( ). Dengan demikian, gabungan nilai acak dari distribusi ini akan, setidaknya, stasioner tingkat kedua. Namun, kurtosis pada titik-titik yang diatur oleh distribusi Gaussian akan menjadi , sedangkan pada titik-titik waktu di mana data berasal dari distribusi Student akan menjadi . Oleh karena itu, data yang dihasilkan dengan cara ini tidak stasioner dalam arti yang ketat karena saat-saat urutan keempat tidak konstan.3 t 3 + 6 / ( 5 - 4 ) = 95 / 33t3 + 6 / ( 5 - 4 ) = 9
Kovarian juga konstan dan sama dengan nol, karena kami menganggap pengamatan independen. Ini mungkin tampak sepele, jadi kita dapat membuat beberapa ketergantungan di antara pengamatan menurut model autoregresif berikut.
ε t ~ { N ( 0 , σ 2 = 5 / 3 )
yt= ϕ yt - 1+ ϵt,| ϕ | < 1,t = 1 , 2 , . . . , 120
dengan
ϵt∼ { N( 0 , σ2= 5 / 3 )t5jikat ∈ [ 0 , 20 ] , [ 41 , 60 ] , [ 81 , 100 ]jikat ∈ [ 21 , 40 ] , [ 61 , 80 ] , [ 101 , 120 ].
| ϕ | < 1 memastikan bahwa stasioneritas orde kedua terpenuhi.
Kita dapat mensimulasikan beberapa seri ini dalam perangkat lunak R dan memeriksa apakah rerata sampel, varians, kovarians orde pertama, dan kurtosis tetap konstan dalam kumpulan pengamatan (kode di bawah ini menggunakan dan ukuran sampel , Gambar menampilkan salah satu seri yang disimulasikan):20ϕ = 0,8n = 240
# this function is required below
kurtosis <- function(x)
{
n <- length(x)
m1 <- sum(x)/n
m2 <- sum((x - m1)^2)/n
m3 <- sum((x - m1)^3)/n
m4 <- sum((x - m1)^4)/n
b1 <- (m3/m2^(3/2))^2
(m4/m2^2)
}
# begin simulation
set.seed(123)
n <- 240
Mmeans <- Mvars <- Mcovs <- Mkurts <- matrix(nrow = 1000, ncol = n/20)
for (i in seq(nrow(Mmeans)))
{
eps1 <- rnorm(n = n/2, sd = sqrt(5/3))
eps2 <- rt(n = n/2, df = 5)
eps <- c(eps1[1:20], eps2[1:20], eps1[21:40], eps2[21:40], eps1[41:60], eps2[41:60],
eps1[61:80], eps2[61:80], eps1[81:100], eps2[81:100], eps1[101:120], eps2[101:120])
y <- arima.sim(n = n, model = list(order = c(1,0,0), ar = 0.8), innov = eps)
ly <- split(y, gl(n/20, 20))
Mmeans[i,] <- unlist(lapply(ly, mean))
Mvars[i,] <- unlist(lapply(ly, var))
Mcovs[i,] <- unlist(lapply(ly, function(x)
acf(x, lag.max = 1, type = "cov", plot = FALSE)$acf[2,,1]))
Mkurts[i,] <- unlist(lapply(ly, kurtosis))
}
Hasilnya tidak seperti yang saya harapkan:
round(colMeans(Mmeans), 4)
# [1] 0.0549 -0.0102 -0.0077 -0.0624 -0.0355 -0.0120 0.0191 0.0094 -0.0384
# [10] 0.0390 -0.0056 -0.0236
round(colMeans(Mvars), 4)
# [1] 3.0430 3.0769 3.1963 3.1102 3.1551 3.2853 3.1344 3.2351 3.2053 3.1714
# [11] 3.1115 3.2148
round(colMeans(Mcovs), 4)
# [1] 1.8417 1.8675 1.9571 1.8940 1.9175 2.0123 1.8905 1.9863 1.9653 1.9313
# [11] 1.8820 1.9491
round(colMeans(Mkurts), 4)
# [1] 2.4603 2.5800 2.4576 2.5927 2.5048 2.6269 2.5251 2.5340 2.4762 2.5731
# [11] 2.5001 2.6279
Rerata, varians dan kovarians relatif konstan antar batch seperti yang diharapkan untuk proses stasioner orde kedua. Namun, kurtosis tetap relatif konstan juga. Kita bisa mengharapkan nilai yang lebih tinggi dari kurtosis pada kumpulan yang terkait dengan penarikan dari distribusi- Student . Mungkin pengamatan tidak cukup untuk menangkap perubahan dalam kurtosis. Jika kami tidak tahu proses pembuatan data dari seri ini dan kami melihat statistik bergulir, kami mungkin akan menyimpulkan bahwa seri ini stasioner setidaknya hingga urutan keempat. Entah saya tidak mengambil contoh yang tepat atau beberapa fitur dari seri mendapatkan topeng untuk ukuran sampel ini.20t20