Definisi waktu autokorelasi (untuk ukuran sampel yang efektif)

23

Saya telah menemukan dua definisi dalam literatur untuk waktu autokorelasi dari serangkaian waktu yang stasioner:

τ_{a} = 1 + 2 \sum_{k = 1}^{\infty} ρ_{k} versus τ_{b} = 1 + 2 \sum_{k = 1}^{\infty} | ρ_{k} |

$\tau_a = 1+2\sum_{k=1}^\infty \rho_k \quad \text{versus} \quad \tau_b = 1+2\sum_{k=1}^\infty \left|\rho_k\right|$

di mana adalah autokorelasi pada lag. $\rho_k = \frac{\text{Cov}[X_t,X_{t+h}]}{\text{Var}[X_t]}$ $k$

Salah satu penerapan waktu autokorelasi adalah menemukan "ukuran sampel efektif": jika Anda memiliki pengamatan seri waktu, dan Anda tahu waktu autokorelasi , maka Anda dapat berpura-pura memiliki $n$ $\tau$

n_{eff} = \frac{n}{τ}

$n_\text{eff} = \frac{n}{\tau}$

sampel independen bukannya berkorelasi untuk tujuan menemukan rata-rata. Memperkirakan dari data adalah non-sepele, tetapi ada beberapa cara untuk melakukannya (lihat Thompson 2010 ). $n$ $\tau$

Definisi tanpa nilai absolut, , tampaknya lebih umum dalam literatur; tetapi ia mengakui kemungkinan . Menggunakan paket R dan "coda": $\tau_a$ $\tau_a<1$

require(coda)
ts.uncorr <- arima.sim(model=list(),n=10000)         # white noise 
ts.corr <- arima.sim(model=list(ar=-0.5),n=10000)    # AR(1)
effectiveSize(ts.uncorr)                             # Sanity check
    # result should be close to 10000
effectiveSize(ts.corr)
    # result is in the neighborhood of 30000... ???

Fungsi "effectiveSize" dalam "coda" menggunakan definisi waktu autokorelasi yang setara dengan , di atas. Ada beberapa paket R lain di luar sana yang menghitung ukuran sampel efektif atau waktu autokorelasi, dan semua yang saya coba memberikan hasil yang konsisten dengan ini: bahwa proses AR (1) dengan koefisien AR negatif memiliki $\tau_a$ sampel lebih efektif daripada yang berkorelasi seri waktu. Ini sepertinya aneh.

Jelas, ini tidak akan pernah terjadi di $\tau_b$ definisi waktu autokorelasi .

Apa definisi waktu autokorelasi yang benar? Apakah ada yang salah dengan pemahaman saya tentang ukuran sampel yang efektif? Hasil ditunjukkan di atas sepertinya salah ... apa yang terjadi? $n_\text{eff} > n$

r time-series correlation

— andrewtinka
sumber

Hanya untuk memastikan saya tidak disalahpahami tidak yang seharusnya

bukan

?

C o v (X_{t}, X_{t + k})

$Cov(X_t,X_{t+k})$

h

$h$

— sachinruk

2

Saya tertarik pada definisi kedua, yaitu,

. Bisakah Anda memberikan literatur di tempat Anda menemukannya?

τ_{b}

$\tau_b$

— Harry

17

$X_1, X_2, \ldots$ $\mu$

\hat{μ} = \frac{1}{n} \sum_{k = 1}^{n} X_{k}

$\hat{\mu} = \frac{1}{n} \sum_{k=1}^n X_k$

μ

$\mu$

n^{- 1}

$n^{-1}$

\hat{μ}

$\hat{\mu}$

\frac{1}{n^{2}} \sum_{k, l = 1}^{n} cov (X_{k}, X_{l}) = \frac{1}{n} (1 + 2 (\frac{n - 1}{n} ρ_{1} + \frac{n - 2}{n} ρ_{2} + \dots + \frac{1}{n} ρ_{n - 1})) ≃ \frac{τ_{a}}{n} .

$\frac{1}{n^2} \sum_{k, l=1}^n \text{cov}(X_k, X_l) = \frac{1}{n}\left(1 + 2\left(\frac{n-1}{n} \rho_1 + \frac{n-2}{n} \rho_2 + \ldots + \frac{1}{n} \rho_{n-1}\right) \right) \simeq \frac{\tau_a}{n}.$

n

$n$

n_{eff} = n / τ_{a}

$n_{\text{eff}} = n/\tau_a$

n_{eff}^{- 1}

$n_{\text{eff}}^{-1}$

n_{eff}

$n_{\text{eff}}$

n_{eff} = n / τ_{a}

$n_{\text{eff}} = n/\tau_a$

$n^{-1}$ $n_{\text{eff}} > n$

— NRH
sumber

2

Bagi siapa saja yang ingin tahu lebih banyak tentang penggunaan korelasi negatif dalam simulasi Monte Carlo, cobalah googling "antitesis variates". Info lebih lanjut dalam catatan kursus di sini atau di sini .

— andrewtinka

1

Lihat http://arxiv.org/pdf/1403.5536v1.pdf

dan

https://cran.r-project.org/web/packages/mcmcse/mcmcse.pdf

untuk ukuran sampel yang efektif. Saya pikir formulasi alternatif menggunakan rasio varians sampel dan varians rantai Markov asimptotik melalui batch rata-rata adalah penduga yang lebih tepat.

— sobat subhadip
sumber

4

Bisakah Anda memperluas konten di tautan tersebut? Sebagaimana adanya, ini terlalu pendek untuk dijawab oleh standar kita!

— kjetil b halvorsen