Bagaimana menafsirkan koefisien tahap kedua dalam regresi variabel instrumental dengan instrumen biner dan variabel endogen biner?

(posting yang cukup panjang, maaf. Ini termasuk banyak info latar belakang, jadi silakan lewati ke pertanyaan di bagian bawah.)

Intro: Saya sedang mengerjakan sebuah proyek di mana kami mencoba mengidentifikasi efek dari variabel endogen biner, , pada hasil yang berkelanjutan, . Kami memiliki datang dengan instrumen, , bahwa kita sangat percaya untuk menjadi seperti-jika-acak. $x_1$ $y$ $z_1$

Data: Data itu sendiri berada dalam struktur panel dengan sekitar 34.000 pengamatan tersebar di 1000 unit dan sekitar 56 periode waktu. mengambil nilai 1 untuk sekitar 700 (2%) dari pengamatan, dan melakukannya untuk sekitar 3000 (9%). 111 (0,33%) pengamatan skor 1 pada dan , dan dua kali lebih mungkin untuk pengamatan untuk skor 1 pada jika juga skor 1 pada . $x_1$ $z_1$ $z_1$ $x_1$ $x_1$ $z_1$

Estimasi: Kami memperkirakan model 2SLS berikut melalui prosedur ivreg2 Stata:

x_{1} = π_{0} + π_{1} z_{1} + Z π + v

$x_1 = \pi_0 + \pi_1z_1 + \mathbf{Z}\mathbf{\pi} + v$

y = β_{0} + β_{1} x_{1}^{*} + Z β + u

$y = \beta_0 + \beta_1 x_1^* + \mathbf{Z}\mathbf{\beta} + u$

Di mana adalah vektor dari variabel eksogen lainnya, adalah nilai prediksi dari tahap pertama, dan dan adalah istilah kesalahan. $Z$ $x_1^*$ $x_1$ $u$ $v$

$\pi_1$ $\beta_1$ $\beta_1$

$y$ $\beta_1$

$i.i.d.$

Menurut uji AR mereka, batas bawah interval kepercayaan 95% untuk koefisien tahap kedua adalah antara 16 dan 29 (sekali lagi tergantung pada spesifikasi). Peluang penolakan praktis 1 untuk semua nilai mendekati nol.

Pengamatan berpengaruh: Kami telah mencoba memperkirakan model dengan setiap unit dihapus secara individual, dengan masing-masing pengamatan dihapus secara individual, dan dengan kelompok unit dihapus. Tidak ada perubahan nyata.

$x_1$ $x_1^*$ $x_1$ $x_1^*$ $0.018*30 = 0.54$ (spesifikasi lain memberikan hasil yang hampir identik). Ini akan jauh lebih masuk akal (namun masih substansial). Sepertinya solusi yang tepat. Kecuali saya belum pernah melihat orang melakukan itu; setiap orang tampaknya menafsirkan koefisien tahap kedua menggunakan metrik variabel endogen asli.

Pertanyaan: Dalam model-IV, apakah benar untuk merangkum efek yang diperkirakan (LATE, benar-benar) dari peningkatan variabel endogen dengan menggunakan metrik dari versi prediksi itu? Dalam kasus kami, metrik tersebut merupakan prediksi probabilitas.

Catatan: Kami menggunakan 2SLS meskipun kami memiliki variabel endogen biner (menjadikan tahap pertama sebagai LPM). Ini mengikuti Angrist & Krueger (2001): "Variabel Instrumental dan Pencarian Identifikasi: Dari Pasokan dan Permintaan ke Eksperimen Alami") Kami juga telah mencoba prosedur tiga tahap yang digunakan di Adams, Almeida, & Ferreira (2009): " Memahami hubungan antara pendiri-CEO dan kinerja perusahaan ”. Pendekatan terakhir, yang terdiri dari model probit diikuti oleh 2SLS, menghasilkan koefisien yang lebih kecil dan lebih masuk akal, tetapi mereka masih sangat besar jika ditafsirkan dalam metrik 0-1 (sekitar 9-10). Kami mendapatkan hasil yang sama dengan perhitungan manual seperti yang kami lakukan dengan opsi probit-2sls-di ivtreatreg Cerulli.

— Bertel
sumber

Sudahkah Anda mencoba etregress/treatreg?

— Dimitriy V. Masterov

Hai Dimitriy, terima kasih atas tanggapannya! Saya sudah mencoba etregress sekarang, dan itu memberikan hasil yang agak mirip. Namun, membaca manual Stata dan Wooldridge (2002): "Analisis ekonometrik data penampang dan panel" Saya mendapatkan kesan bahwa model regresi-pengobatan ini mengasumsikan ketidakmampuan pengobatan. Artinya, tergantung pada variabel yang diamati, apakah sebuah unit dirawat atau tidak, tidak tergantung pada hasil (potensial) baik di bawah perawatan dan kontrol.

— Bertel

x

$x$

{\hat{β}}_{1} = β_{1} + \frac{C o v (z_{1}, u)}{C o v (z_{1}, x_{1})}

$\hat{\beta}_1 = \beta_1 + \frac{Cov(z_1,u)}{Cov(z_1,x_1)}$

β_{1}

$\beta_1$

$\beta_1$ $\alpha_1$

y = α_{0} + α_{1} z_{1} + Z α + u

$y = \alpha_0 + \alpha_1 z_1 + \mathbf{Z}\mathbf{\alpha} + u$

$\pi_1$

x_{1} = π_{0} + π_{1} z_{1} + Z π + v

$x_1 = \pi_0 + \pi_1z_1 + \mathbf{Z}\mathbf{\pi} + v$

$\beta_1$ $\alpha_1$ $\pi_1$

$\alpha_1$ $\pi_1$ $\hat{\alpha}_1$ $\hat{\pi}_1$ $\hat{\beta}_1$

— Peter
sumber