Korelasi antara dua deret waktu


24

Apa cara / metode termudah untuk menghitung korelasi antara dua seri waktu yang ukurannya persis sama? Saya berpikir untuk mengalikan dan ( y [ t ] - μ y ) , dan menambahkan perkaliannya. Jadi, jika angka tunggal ini positif, dapatkah kita mengatakan bahwa kedua seri ini berkorelasi? Namun saya dapat memikirkan beberapa contoh di mana deret waktu yang tumbuh secara eksponensial lain tidak memiliki hubungan satu sama lain, tetapi perhitungan di atas akan melaporkan bahwa mereka berkorelasi.(x[t]μx)(y[t]μy)

Adakah pikiran?


3
Pernahkah Anda mendengar tentang fungsi korelasi silang - en.wikipedia.org/wiki/Cross-correlation#Time_series_analysis ?
Makro

Dua seri waktu Anda berukuran persis sama. Lihat stats.stackexchange.com/questions/3463/… karena mirip, tidak cukup identik dengan pertanyaan Anda, dengan dua seri ukuran dan frekuensi yang sama, meskipun tidak stasioner.
Ellie Kesselman

Jawaban:


11

Poin makro adalah benar cara yang tepat untuk membandingkan hubungan antara deret waktu dengan fungsi korelasi silang (dengan asumsi stasioneritas). Memiliki panjang yang sama tidak penting. Korelasi silang pada lag 0 hanya menghitung korelasi seperti melakukan estimasi korelasi Pearson memasangkan data pada titik waktu yang sama. Jika mereka memiliki panjang yang sama dengan asumsi Anda, Anda akan memiliki pasangan T yang tepat di mana T adalah jumlah titik waktu untuk setiap seri. Korelasi silang Lag 1 cocok dengan waktu t dari seri 1 dengan waktu t + 1 pada seri 2. Perhatikan bahwa meskipun seri memiliki panjang yang sama, Anda hanya memiliki pasangan T-2 karena satu titik di seri pertama tidak memiliki kecocokan di seri kedua. dan satu poin lain di seri kedua tidak akan memiliki kecocokan dari yang pertama. Dengan kedua seri ini, Anda dapat memperkirakan korelasi silang pada beberapa lag. Jika salah satu dari korelasi silang secara statistik berbeda nyata dari 0 itu akan menunjukkan korelasi antara kedua seri.


Hai Michael, apakah mungkin untuk menghitung "berbeda nyata" - dapatkah saya menggunakan 1 atau 2 standar deviasi dari nol sebagai signifikan?
BBDynSys

@ user423805 Saya telah mengubahnya untuk membaca secara statistik berbeda dari 0. Secara formal itu berarti Anda menguji hipotesis nol bahwa korelasinya nol vs alternatif yang bukan 0. Kemudian menghitung nilai p dua sisi untuk statistik uji . Secara umum signifikansi statistik berarti p-value <= 0,05. Terkadang nilai-nilai lain digunakan untuk mendefinisikan signifikansi statistik (0,01 misalnya). Sebagian besar paket perangkat lunak deret waktu yang mencakup seri waktu mutiple dapat melakukan tes ini untuk Anda. Teman kami, IrishStat dapat membicarakan hal ini tentang Autobox.
Michael R. Chernick

adakah kasus di mana korelasi silang pada lag nol dan pearson berbeda?
Bakaburg

4

Anda mungkin ingin melihat pertanyaan serupa dan jawaban saya Berkorelasi dengan jadwal waktu volume yang menunjukkan bahwa Anda dapat menghitung korelasi silang TETAPI mengujinya adalah kuda dengan warna yang berbeda (kuda dengan warna berbeda) karena struktur autoregresif atau deterministik dalam salah satu seri.


jika saya mengerti dengan benar, dalam jawaban itu Anda mengatakan hubungan silang antara deret waktu tidak berguna.
BBDynSys

user423805 MUNGKIN tidak berguna kecuali data disaring dengan tepat untuk mendapatkan IID. Ini berbicara langsung ke keprihatinan nyata OP tentang kesimpulan palsu seperti "bangau yang membawa bayi J. Neyman 1938 en.wikipedia.org/wiki/… dan amstat.org/about / statsisticiansinhistory /… "etc (saya dapat memikirkan beberapa contoh namun di mana deret waktu yang tumbuh secara eksponensial lain tidak memiliki hubungan satu sama lain, tetapi perhitungan di atas akan melaporkan bahwa mereka berkorelasi.)
IrishStat

Saya pikir intinya adalah bahwa seri harus stasioner agar hubungan silang masuk akal. Jika penyaringan diperlukan, lakukan mske seri stasioner (seperti differencing atau musiman differencing). Tetapi menyebutnya tidak berguna itu salah.
Michael R. Chernick

@Michael aku berkata MUNGKIN tidak berguna.
IrishStat

@IrishStat Itu komentar yang bagus dan membawa saya kembali ke pelatihan saya di tahun 1970-an. Pada waktu itu saya sedang belajar tentang deret waktu / metode perkiraan untuk pekerjaan sipil saya di Angkatan Darat AS. Kami menggunakan pemulusan eksponensial sebagai cara untuk meramalkan berdasarkan data historis atas perkiraan subyektif yang digunakan di depot pasokan. Seseorang membuat saran besar bagi saya untuk melihat model ARIMA yang lebih umum dan teks tahun 1970 oleh Box dan Jenkins dan mulai minat saya pada seri waktu yang menjadi bagian dari karir saya.
Michael R. Chernick

-1

Ada beberapa hal menarik di sini

/programming/3949226/calculating-pearson-correlation-and-significance-in-python

Ini sebenarnya yang saya butuhkan. Mudah diimplementasikan dan dijelaskan.


2
-1 Dari apa yang saya dapat kumpulkan jawaban ini hanya berkaitan dengan korelasi momen-produk Pearson standar. Ketika diterapkan pada dua seri waktu, korelasi Pearson standar memberikan hasil yang tidak masuk akal! Jika Anda mengikuti saran ini, yang Anda lakukan hanyalah menghasilkan artefak statistik. Lihat misalnya math.mcgill.ca/dstephens/OldCourses/204-2007/Handouts/…
Momo
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.