Ada beberapa suara kuat dalam komunitas Ekonometrik terhadap validitas Ljung-Box -statistic untuk pengujian autokorelasi berdasarkan residu dari model autoregresif (yaitu dengan variabel dependen tertinggal dalam matriks regressor), lihat khususnya Maddala (2001) "Pengantar Ekonometrika (edisi 3d), bab 6.7, dan 13. 5 hal 528. Maddala benar-benar menyesalkan meluasnya penggunaan tes ini, dan sebagai gantinya dianggap pantas sebagai tes" Pengganda Langrange "dari Breusch dan Godfrey.Q
Argumen Maddala terhadap tes Ljung-Box sama dengan yang diajukan terhadap tes autokorelasi lain yang ada di mana-mana, yaitu "Durbin-Watson": dengan variabel dependen tertinggal dalam matriks regressor, tes ini bias dalam mendukung mempertahankan hipotesis nol dari "no-autocorrelation" (hasil Monte-Carlo diperoleh dalam jawaban @javlacalle menyinggung fakta ini). Maddala juga menyebutkan rendahnya daya ujian, lihat misalnya Davies, N., & Newbold, P. (1979). Beberapa studi kekuatan dari uji portmanteau spesifikasi model deret waktu. Biometrika, 66 (1), 153-155 .
Hayashi (2000) , ch. 2.10 "Pengujian Untuk korelasi serial" , menyajikan analisis teoritis terpadu, dan saya percaya, mengklarifikasi masalah ini. Hayashi mulai dari nol: UntukstatistikLjung-Boxakan didistribusikan secara asimptot sebagai chi-square, itu harus menjadi kasus yang memproses(apa pun yangdiwakili), yang sampel autokorelasinya kamike dalam statistik adalah, di bawah hipotesis nol dari tidak ada autokorelasi, urutan perbedaan martingale, yaitu memenuhi{ z t } zQ{zt}z
E(zt∣zt−1,zt−2,...)=0
dan juga menunjukkan homoskedasticity kondisional "sendiri"
E(z2t∣zt−1,zt−2,...)=σ2>0
Dalam kondisi ini, Ljung-Box -statistic (yang merupakan varian sampel yang dikoreksi-untuk-terbatas-sampel dari Box-Pierce Q -statistic), secara asimptotik merupakan distribusi chi-squared, dan penggunaannya memiliki justifikasi asimtotik. QQ
Asumsikan sekarang bahwa kita telah menetapkan model autoregresif (yang mungkin juga termasuk regressor independen selain variabel dependen yang tertinggal), katakanlah
yt= x′tβ+ ϕ ( L ) yt+ ut
di mana adalah polinomial dalam operator lag, dan kami ingin menguji korelasi serial dengan menggunakan residu estimasi. Jadi di sini z t ≡ u t . ϕ ( L )zt≡ kamu^t
Hayashi menunjukkan bahwa agar statistik Ljung-Box berdasarkan pada autokorelasi sampel residu, untuk memiliki distribusi chi-square asimptotik di bawah hipotesis nol tanpa autokorelasi, itu harus menjadi kasus bahwa semua regresor "benar-benar eksogen" " ke istilah kesalahan dalam pengertian berikut:Q
E( xt⋅ kamus) = 0 ,E( yt⋅ kamus) = 0∀t,s
The "untuk semua " adalah persyaratan penting di sini, salah satu yang mencerminkan exogeneity ketat. Dan itu tidak berlaku ketika variabel dependen tertinggal ada dalam matriks regressor. Ini mudah dilihat: set s = t - 1 lalut,ss=t−1
E[ytut−1]=E[(x′tβ+ϕ(L)yt+ut)ut−1]=
E[x′tβ⋅ut−1]+E[ϕ(L)yt⋅ut−1]+E[ut⋅ut−1]≠0
bahkan jika adalah independen dari istilah kesalahan, dan bahkan jika istilah kesalahan tidak memiliki autokorelasi : istilah E [ ϕ ( L ) y t ⋅ u t - 1 ] bukan nol. XE[ϕ(L)yt⋅ut−1]
Tetapi ini membuktikan bahwa statistik Ljung-Box tidak valid dalam model autoregresif, karena tidak dapat dikatakan memiliki distribusi chi-square asimptotik di bawah nol.Q
Asumsikan sekarang bahwa kondisi yang lebih lemah daripada eksogenitas ketat terpenuhi, yaitu itu
E(ut∣xt,xt−1,...,ϕ(L)yt,ut−1,ut - 2, . . . ) = 0
Kekuatan dari kondisi ini adalah "ketidakseimbangan" antara eksogenitas dan ortogonalitas yang ketat. Di bawah nol tanpa autokorelasi dari istilah kesalahan, kondisi ini "secara otomatis" dipenuhi oleh model autoregresif, sehubungan dengan variabel dependen yang tertinggal (untuk itu tentu saja harus diasumsikan secara terpisah).X
Kemudian, ada statistik lain berdasarkan autokorelasi sampel residu, ( bukan Ljung-Box satu), yang memang memiliki distribusi chi-square asimptotik di bawah nol. Statistik lain ini dapat dihitung, sebagai kenyamanan, dengan menggunakan "regresi tambahan" dengan rute: regresi residual pada matriks regressor penuh dan pada residual masa lalu (sampai dengan lag kami telah digunakan di spesifikasi), mendapatkan uncentered R 2 dari regresi auxilliary ini dan kalikan dengan ukuran sampel.{ u^t} R2
Statistik ini digunakan dalam apa yang kita sebut "tes Breusch-Godfrey untuk korelasi serial" .
Tampaknya kemudian, ketika regressor menyertakan variabel dependen yang tertinggal (dan juga dalam semua kasus model autoregresif), uji Ljung-Box harus ditinggalkan demi uji Breusch-Godfrey LM. , bukan karena "berkinerja lebih buruk", tetapi karena tidak memiliki justifikasi asimptotik. Hasil yang cukup mengesankan, terutama dilihat dari keberadaan dan penerapannya di mana-mana.
PEMBARUAN: Menanggapi keraguan yang muncul dalam komentar, apakah semua hal di atas berlaku juga untuk model seri waktu "murni" atau tidak (yaitu tanpa " " -regressor), saya telah memposting pemeriksaan terperinci untuk model AR (1), di https://stats.stackexchange.com/a/205262/28746 .x