Versi sederhana adalah bahwa setiap dua variabel yang cenderung berubah dalam satu arah dari waktu ke waktu akan tampak berkorelasi, apakah ada hubungan di antara mereka atau tidak. Pertimbangkan variabel-variabel berikut:
set.seed(1)
time = seq(from=1, to=100, by=1)
x = .5 + .3*time + rnorm(100)
y1 = 3 + .3*time + rnorm(100)
y2 = 7 + .1*time + .8*x + rnorm(100)
hanyalah fungsi waktu, seperti halnya y 1 . y 2 adalah fungsi dari kedua waktu dan x . Intinya adalah mengenali dari kode bahwa benar-benar ada hubungan antara x dan y 2 , dan bahwa tidak ada hubungan antara x dan y 1 . Sekarang lihat gambar berikut, ketiga garis terlihat sangat mirip, bukan?xy1y2xxy2xy1
R2xy1R2xy2xy1xy2, jadi bagaimana kita membedakan yang nyata dari penampilan belaka? Di situlah perbedaan masuk. Untuk setiap dua variabel, karena keduanya cenderung naik seiring waktu, itu tidak terlalu informatif, tetapi mengingat bahwa satu naik dengan jumlah tertentu, apakah itu memberi tahu kita berapa banyak yang lain naik? Perbedaan memungkinkan kita untuk menjawab pertanyaan itu. Perhatikan dua gambar berikut, scatterplots yang saya buat setelah membedakan ketiga variabel.
xy2R2=.43xy1R2=.07R2
Beberapa poin lain: Dalam gambar, saya menekankan bahwa ini adalah perubahan simultan. Tidak ada yang salah dengan itu, dan itu mengikuti dari cara saya mengatur masalah, tetapi biasanya orang tertarik pada efek di beberapa lag. (Yaitu, perubahan dalam satu hal pada satu titik waktu menyebabkan perubahan pada hal lain nanti.) Kedua, Anda menyebutkan mengambil log dari salah satu seri Anda. Mengambil log cukup dengan mengalihkan data Anda dari level ke kurs. Dan dengan demikian, ketika Anda berbeda, Anda melihat perubahan tingkat daripada perubahan tingkat. Itu sangat umum, tetapi saya tidak memasukkan elemen itu dalam demonstrasi saya; itu ortogonal dengan masalah yang saya diskusikan. Terakhir, saya ingin mengakui bahwa data deret waktu sering lebih rumit daripada demonstrasi saya.