Fitur perbedaan-dalam-perbedaan (DiD) yang bagus sebenarnya adalah Anda tidak memerlukan data panel untuk itu. Mengingat bahwa perawatan terjadi pada semacam tingkat agregasi (di kota kasus Anda), Anda hanya perlu mengambil sampel individu acak dari kota-kota sebelum dan setelah perawatan. Hal ini memungkinkan Anda untuk memperkirakan
dan mendapatkan efek kausal dari perawatan sebagai perbedaan hasil pasca-perkiraan yang diharapkan untuk diperlakukan dikurangi perbedaan hasil post-pre yang diharapkan untuk kontrol.
yist=Ag+Bt+βDst+cXist+ϵist
Ada kasus di mana orang menggunakan efek tetap individu alih-alih indikator pengobatan dan ini adalah ketika kita tidak memiliki tingkat agregasi yang terdefinisi dengan baik di mana pengobatan terjadi. Dalam hal ini Anda akan memperkirakan
mana adalah indikator untuk periode pasca perawatan untuk individu yang menerima perawatan (misalnya, program pasar kerja yang terjadi di semua tempat). Untuk informasi lebih lanjut tentang ini, lihat catatan kuliah ini oleh Steve Pischke.
yit=αi+Bt+βDit+cXit+ϵit
Dit
Di pengaturan Anda, menambahkan efek tetap individual tidak boleh mengubah apa pun sehubungan dengan perkiraan titik. Indikator pengobatan hanya akan diserap oleh efek tetap individu. Namun, efek-efek tetap ini mungkin menyerap sebagian dari varians residual dan karenanya berpotensi mengurangi kesalahan standar dari koefisien DiD Anda.Ag
Berikut adalah contoh kode yang menunjukkan bahwa ini adalah masalahnya. Saya menggunakan Stata tetapi Anda dapat meniru ini dalam paket statistik pilihan Anda. "Individu" di sini sebenarnya adalah negara tetapi mereka masih dikelompokkan berdasarkan beberapa indikator perawatan.
* load the data set (requires an internet connection)
use "http://dss.princeton.edu/training/Panel101.dta"
* generate the time and treatment group indicators and their interaction
gen time = (year>=1994) & !missing(year)
gen treated = (country>4) & !missing(country)
gen did = time*treated
* do the standard DiD regression
reg y_bin time treated did
------------------------------------------------------------------------------
y_bin | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
time | .375 .1212795 3.09 0.003 .1328576 .6171424
treated | .4166667 .1434998 2.90 0.005 .13016 .7031734
did | -.4027778 .1852575 -2.17 0.033 -.7726563 -.0328992
_cons | .5 .0939427 5.32 0.000 .3124373 .6875627
------------------------------------------------------------------------------
* now repeat the same regression but also including country fixed effects
areg y_bin did time treated, a(country)
------------------------------------------------------------------------------
y_bin | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
time | .375 .120084 3.12 0.003 .1348773 .6151227
treated | 0 (omitted)
did | -.4027778 .1834313 -2.20 0.032 -.7695713 -.0359843
_cons | .6785714 .070314 9.65 0.000 .53797 .8191729
-------------+----------------------------------------------------------------
Jadi Anda melihat bahwa koefisien DiD tetap sama ketika masing-masing efek tetap dimasukkan ( areg
adalah salah satu perintah estimasi efek tetap yang tersedia di Stata). Kesalahan standar sedikit lebih ketat dan indikator pengobatan asli kami diserap oleh efek tetap individu dan oleh karena itu menurun dalam regresi.
Menanggapi komentar yang
saya sebutkan contoh Pischke untuk menunjukkan ketika orang menggunakan efek tetap individu daripada indikator kelompok pengobatan. Pengaturan Anda memiliki struktur grup yang terdefinisi dengan baik sehingga cara Anda menulis model Anda baik-baik saja. Kesalahan standar harus dikelompokkan di tingkat kota, yaitu tingkat agregasi di mana perlakuan terjadi (saya belum melakukan ini dalam kode contoh tetapi dalam pengaturan DID kesalahan standar perlu diperbaiki seperti yang ditunjukkan oleh kertas Bertrand et al. ).
Mengenai penggerak, mereka tidak memiliki banyak peran untuk dimainkan di sini. Perlakuan Indikator adalah sama dengan 1 untuk orang-orang yang tinggal di kota dirawat di pos-pengolahan periode . Untuk menghitung koefisien DiD, kita sebenarnya hanya perlu menghitung empat harapan bersyarat, yaitu
Dstst
c=[E(yist|s=1,t=1)−E(yist|s=1,t=0)]−[E(yist|s=0,t=1)−E(yist|s=0,t=0)]
Jadi jika Anda memiliki 4 periode pasca perawatan untuk seorang individu yang tinggal di kota yang dirawat untuk dua yang pertama, dan kemudian pindah ke kota kontrol untuk dua periode yang tersisa, dua pengamatan pertama akan digunakan dalam perhitungan dan dua terakhir di . Untuk memperjelas mengapa identifikasi berasal dari perbedaan kelompok dari waktu ke waktu dan bukan dari penggerak Anda dapat memvisualisasikan ini dengan grafik sederhana. Misalkan perubahan dalam hasil benar-benar hanya karena perawatan dan bahwa ia memiliki efek kontemporer. Jika kita memiliki seseorang yang tinggal di kota yang dirawat setelah perawatan dimulai tetapi kemudian pindah ke kota kontrol, hasilnya harus kembali ke keadaan sebelum mereka dirawat. Ini ditunjukkan dalam grafik bergaya di bawah ini.E(yist|s=1,t=1)E(yist|s=0,t=1)
Anda mungkin masih ingin berpikir tentang penggerak untuk alasan lain. Misalnya, jika pengobatan memiliki efek yang bertahan lama (yaitu masih mempengaruhi hasil meskipun individu telah pindah)