Pertanyaan saat ini mengasumsikan bahwa kuantitas berkorelasi, yang menyiratkan bahwa orang yang menentukan korelasi harus memiliki alasan yang baik untuk percaya bahwa variabel-variabel tersebut memiliki hubungan linier.
Granger Causality mungkin menjadi alat terbaik untuk menentukan hubungan kausal linier. Granger adalah seorang ekonom yang berbagi hadiah nobel untuk karyanya tentang Penyebab linear.
Granger menyarankan itu untuk satu set variabel {X( i )t}ki = 1 untuk dianggap sebagai sebab akibat Yt, dua syarat harus berlaku:
- Penyebabnya harus terjadi sebelum efek.
- Penyebabnya harus berisi informasi tentang efek yang tidak tersedia.
Untuk menemukan informasi yang dibagikan, seseorang dapat menggunakan regresi (walaupun berhati-hatilah bahwa koefisien regresi yang signifikan tidak menyiratkan informasi yang dibagikan secara teori - hanya dalam praktiknya). Secara khusus, seseorang ingin membandingkan residual dengan dan tanpa variabel penyebab. Anggap variabel sebagai vektor kolom, sehinggaX= [X( 1 )t - 1,X( 1 )t - 2, ... ,X( 1 )t - m,X( 2 )t - 1,X( 2 )t - 2, ... ,X( 2 )t - m, ... ,X( k )t - m]T juga merupakan vektor kolom, dan Y= [Yt -1,Yt - 2, ...,Yt - m]Tadalah vektor kolom. (mdisebut urutan atau jeda waktu. Ada metode untuk memilih secara optimalm, tapi saya pikir orang hanya menebak yang terbaik m atau mendasarkannya pada kendala lain.) Kemudian persamaan regresi yang menarik adalah
Yt= A ⋅ Y+ϵtYt=SEBUAH′⋅ [ Y, X]T+ϵ′t.
Untuk menentukan apakah
X( j )t - i berisi info tentang
Yt orang akan melakukan uji-F pada varian
ϵt dan
ϵ′t.
Untuk memastikan bahwa informasi tersebut tidak diperhitungkan oleh sumber lain, orang akan mengumpulkan setiap variabel lain yang dapat dipertanggungjawabkan, katakanlah Z( 1 )t, ... ,Z( p )t, tentukan Z= [Z( 1 )t - 1,Z( 1 )t - 2, ... ,Z( p )t - m]T, dan lakukan regresi
Yt= A ⋅ [ Y, Z]T+ϵtYt=SEBUAH′⋅ [ Y, X, Z]T+ϵ′t.
dan lakukan uji-F yang sama pada residu.
Ini hanya sketsa kasar dan saya percaya bahwa banyak penulis telah memperbaiki gagasan ini.