Bagaimana cara membandingkan dua seri waktu secara statistik?


43

Saya memiliki dua seri waktu, ditunjukkan dalam plot di bawah ini:

Plot Seri Waktu

Plotnya menunjukkan detail lengkap dari kedua seri waktu tersebut, tetapi saya dapat dengan mudah menguranginya menjadi hanya pengamatan kebetulan jika diperlukan.

Pertanyaan saya adalah: Metode statistik apa yang dapat saya gunakan untuk menilai perbedaan antara rangkaian waktu?

Saya tahu ini adalah pertanyaan yang cukup luas dan tidak jelas, tetapi sepertinya saya tidak dapat menemukan banyak materi pengantar di mana saja ini. Seperti yang saya lihat, ada dua hal berbeda untuk dinilai:

1. Apakah nilainya sama?

2. Apakah trennya sama?

Tes statistik macam apa yang Anda sarankan untuk menilai pertanyaan-pertanyaan ini? Untuk pertanyaan 1, saya jelas dapat menilai cara dari dataset yang berbeda dan mencari perbedaan yang signifikan dalam distribusi, tetapi apakah ada cara untuk melakukan ini yang memperhitungkan sifat time-series data?

Untuk pertanyaan 2 - apakah ada sesuatu seperti tes Mann-Kendall yang mencari kesamaan antara dua tren? Saya bisa melakukan tes Mann-Kendall untuk kedua set data dan membandingkan, tetapi saya tidak tahu apakah itu cara yang valid untuk melakukan sesuatu, atau apakah ada cara yang lebih baik?

Saya melakukan semua ini dalam R, jadi jika tes yang Anda sarankan miliki paket R maka tolong beri tahu saya.


9
Plot tampaknya mengaburkan apa yang mungkin menjadi perbedaan penting antara seri-seri ini: mereka mungkin dijadikan sampel pada frekuensi yang berbeda. Garis hitam (Aeronet) tampaknya disampel hanya sekitar 20 kali dan garis merah (Visibilitas) ratusan kali atau lebih. Faktor kritis lainnya mungkin adalah keteraturan pengambilan sampel, atau ketiadaannya: waktu antara pengamatan Aeronet tampak sedikit berbeda. Secara umum, ini membantu untuk menghapus garis penghubung dan hanya menampilkan titik yang sesuai dengan data aktual, sehingga pemirsa dapat menentukan hal-hal ini secara visual.
whuber

Berikut ini adalah pustaka Python untuk analisis deret waktu yang tidak beraturan.
kjetil b halvorsen

Jawaban:


27

Seperti yang dinyatakan orang lain, Anda harus memiliki frekuensi pengukuran yang sama (yaitu waktu di antara pengamatan). Dengan itu di tempat saya akan mengidentifikasi model umum yang secara wajar akan menggambarkan setiap seri secara terpisah. Ini mungkin merupakan model ARIMA atau Model Regresi berlipat ganda dengan kemungkinan Pergeseran Tingkat atau model komposit yang mengintegrasikan variabel memori (ARIMA) dan variabel dummy. Model umum ini dapat diperkirakan secara global dan terpisah untuk masing-masing dari dua seri dan kemudian seseorang dapat menyusun uji F untuk menguji hipotesis dari serangkaian parameter yang umum.


1
Nah, Anda tidak perlu memiliki frekuensi yang sama untuk kedua seri. Hanya saja begitu tarif ada sedikit perangkat lunak untuk kasus lain, tetapi lihat traces.readthedocs.io/en/latest . Sepertinya banyak yang dipublikasikan tentang kasus-kasus lain di jurnal astronomi dan di bidang keuangan dan geofisika ... lihat referensi di en.wikipedia.org/wiki/Unevenly_spaced_time_series
kjetil b halvorsen

12

Pertimbangkan grangertest()di perpustakaan lmtest .

Ini adalah tes untuk melihat apakah satu rangkaian waktu berguna dalam meramalkan yang lain.

Beberapa referensi untuk membantu Anda memulai:

https://spia.uga.edu/faculty_pages/monogan/teaching/ts/

https://spia.uga.edu/faculty_pages/monogan/teaching/ts/Kgranger.pdf

http://en.wikipedia.org/wiki/Granger_causality


1
Ukuran sampelnya akan terlalu kecil dengan <10 titik data versus jumlah parameter yang harus Anda paskan di Granger.
Jase

1
@fionn, tautan di jawaban Anda sudah mati. Bisakah Anda memperbarui jawaban Anda?
Davor Josipovic

0

Baru saja menemukan ini. Jawaban pertama Anda, kami merencanakan dua set skala yang sama (secara berkala) untuk melihat perbedaan secara visual. Anda telah melakukan ini dan dapat dengan mudah melihat ada beberapa perbedaan mencolok. Langkah selanjutnya adalah menggunakan analisis korelasi sederhana ... dan melihat seberapa baik mereka terkait menggunakan koefisien korelasi (r). Jika r kecil, kesimpulan Anda adalah bahwa keduanya terkait lemah sehingga tidak ada perbandingan yang diinginkan dan nilai yang lebih besar jika r akan menyarankan perbandingan yang baik antara kedua seri. Langkah ketiga di mana ada korelasi yang baik adalah untuk menguji signifikansi statistik r. Di sini Anda dapat menggunakan tes Welch Shapiro yang akan menganggap kedua seri terdistribusi normal (hipotesis nol) atau tidak (hipotesis alternatif). Ada beberapa tes lain yang dapat Anda lakukan tetapi biarkan saya berharap jawaban saya membantu.


1
Ketika membandingkan deret waktu, ini merupakan autokorelasi dan mungkin cocok dengan deret waktu. seperti model ARIMA yang dapat membantu menentukan seberapa mirip mereka. Dua realisasi dari proses stokastik yang sama tidak harus terlihat sama ketika merencanakannya.
Michael Chernick

-2

Pasang garis lurus ke kedua sinyal deret waktu menggunakan polyfit. Kemudian hitung root-mean-square-error (RMSE) untuk kedua baris. Nilai yang diperoleh untuk garis merah akan sangat kurang dari yang diperoleh untuk garis abu-abu.

Juga lakukan pembacaan pada beberapa frekuensi umum.


2
Selamat datang di Cross Validated dan terima kasih atas jawaban pertama Anda! Namun saya khawatir Anda tidak menjawab pertanyaan secara langsung - bagaimana tepatnya pendekatan yang diusulkan membantu penanya untuk menilai apakah nilai dan / atau trennya sama?
Martin Modrák
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.