Dimasukkannya variabel dependen tertinggal dalam regresi


26

Saya sangat bingung tentang apakah sah untuk memasukkan variabel dependen tertinggal ke dalam model regresi. Pada dasarnya saya pikir jika model ini berfokus pada hubungan antara perubahan Y dan variabel independen lainnya, maka menambahkan variabel dependen tertinggal di sisi kanan dapat menjamin bahwa koefisien sebelum IV lain independen dari nilai Y sebelumnya.

Ada yang mengatakan bahwa dimasukkannya LDV akan menurunkan koefisien IVs lainnya. Beberapa yang lain mengatakan bahwa seseorang dapat memasukkan LDV yang dapat mengurangi korelasi serial.

Saya tahu pertanyaan ini cukup umum dalam hal jenis regresi. Tetapi pengetahuan statistik saya terbatas dan saya benar-benar kesulitan mencari tahu apakah saya harus memasukkan variabel dependen tertinggal ke dalam model regresi ketika fokusnya adalah perubahan Y dari waktu ke waktu.

Apakah ada pendekatan lain untuk menangani pengaruh X pada perubahan Y dari waktu ke waktu? Saya mencoba skor perubahan yang berbeda seperti DV juga, tetapi R kuadrat dalam situasi itu sangat rendah.


1
apa yang ingin Anda capai dengan model Anda? Memaksimalkan R-squared jarang menjadi kriteria pemilihan model yang baik.
Michael Bishop

Model ini akan digunakan untuk prediksi. Memang benar bahwa walaupun R-kuadrat berbeda banyak, nilai yang diprediksi sebenarnya sama dengan menggunakan Y atau perubahan Y. Namun, mengingat nilai R-kuadrat rendah menggunakan perubahan Y sebagai DV, apakah itu berarti bahwa set infus saat ini tidak dapat menjelaskan perubahan dengan sangat baik dan harus ada beberapa variabel yang dihilangkan?
user22109

Jawaban:


19

Keputusan untuk memasukkan variabel dependen tertinggal dalam model Anda benar-benar merupakan pertanyaan teoretis. Masuk akal untuk memasukkan DV yang tertinggal jika Anda berharap level DV saat ini sangat ditentukan oleh level sebelumnya. Dalam hal itu, tidak termasuk DV yang tertinggal akan menyebabkan bias variabel yang dihilangkan dan hasil Anda mungkin tidak dapat diandalkan. Dalam skenario seperti itu, termasuk DV yang tertinggal, akan menghilangkan banyak varians Anda dan cenderung membuat efek DV Anda yang lain menjadi kurang signifikan (yang berarti keduanya membuat lebih kecil dan kesalahan standar lebih besar). Namun, apa yang akan Anda lakukan adalah mengatakan bahwa infus yang masih mempengaruhi hasil Anda memiliki efek mengendalikan nilai DV di masa lalu. Pendekatan alternatif untuk ini adalah menggunakan perbedaan antara variabel hasil Anda pada periode tβtdan sebagai DV Anda untuk periode t .t-1t

Namun, melakukan semua ini menyiratkan menjawab pertanyaan penting: apa struktur lag yang tepat untuk DV Anda? Anda dapat memperoleh beberapa informasi tentang ini dengan mengamati korelasi antara variabel hasil Anda dengan dirinya sendiri untuk nilai lag yang berbeda (mis. Korelasi antara Y dan Y , Y dan Y t - 2 , dll.).t-1t-2


12

Saya merekomendasikan dua artikel:

  1. Achen CH (2001) Mengapa variabel dependen yang tertinggal dapat menekan kekuatan penjelas dari variabel independen lainnya ( tautan )
  2. Keele, L. dan Kelly NJ (2005) Model dinamis untuk teori-teori dinamis: seluk beluk variabel dependen tertinggal ( tautan ).

Hasilnya adalah bahwa termasuk variabel dependen lagged dapat memiliki pengaruh besar pada koefisien variabel yang tersisa. Terkadang ini tepat (untuk model Dinamis Keele dan Kelly) dan terkadang tidak. Seperti yang dikatakan orang lain, penting untuk memikirkan proses yang dimodelkan.


4

Termasuk variabel dependen yang tertinggal dapat mengurangi terjadinya autokorelasi yang timbul dari kesalahan spesifikasi model. Dengan demikian akuntansi untuk variabel dependen tertinggal membantu Anda mempertahankan keberadaan autokorelasi dalam model. Nilai masa lalu memengaruhi masa kini dalam model, membutuhkan landasan teoretis, dan paling sesuai dengan model sesuai kebutuhan.


Tidak yakin saya melakukan keadilan untuk kalimat terakhir; harap edit jika artinya dapat diklarifikasi. Selamat Datang di Cross Validated BTW!
Nick Stauner

1
Autokorelasi dapat menjadi artefak dari cara data dikumpulkan. Saya memperoleh data dengan mendigitalkan plot yang berarti data diurutkan. Penyortiran ini dan hubungan non-linear menyebabkan autokorelasi pada residu.
Tony Ladson

2

Apa yang membuat saya tertarik dengan pertanyaan ini adalah tidak tahu lebih banyak tentang spesifikasi model atau teknik estimasi untuknya. Saya menyebutkan bahwa karena meskipun menggunakan DV yang tertinggal di antara IV mungkin secara teori penting dan metodologis diperlukan, itu juga dapat memperkenalkan jumlah risiko endongeneitas dalam model, tergantung pada hubungan substansial antara variabel dan unit waktu dan, juga, pada AR urutan yang mungkin ada dalam model. Kecuali jika Anda (dan kami) memiliki rincian lebih lanjut tentang variabel dan estimasi, saya tidak akan merasa nyaman untuk merekomendasikan lagging DV kecuali jika Anda memikirkan beberapa teknik variabel instrumental atau sesuatu seperti estimasi Arellano-Bond.

Tolong, beri kami lebih banyak detail sehingga kita bisa tahu lebih baik tentang model apa yang sedang kita bicarakan.


0

Ya, Anda harus waspada terhadap bias Nickell dalam situasi T besar N kecil (Nickell, S. (1981). Bias dalam model dinamis dengan efek tetap. Econometrica: Jurnal Masyarakat Econometrik, 1417-1426.)

Anda mungkin ingin melihat model Data Panel Dinamis seperti penaksir Arellano-Bond atau Blundell-Bond.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.