Ini adalah pertanyaan yang sangat standar pada Instrumental Variables model Single-Equation Linear. Mengingat primitif pertanyaan Anda, satu-satunya variabel endogen adalah olahraga . Untuk menjawab pertanyaan khusus ini, Anda memerlukan variabel eksotis, z , yang memenuhi dua syarat:
- cov (z, u) = 0.
- Pasti ada hubungan antara variabel endogen dan variabel eksogen yang Anda usulkan tetapi itu bukan bagian dari model yang dipostulatkan yang sebenarnya (model struktural). Dengan kata lain,
dengan , dan ortogonal ke semua variabel penjelas Anda (selain dari olahraga) dan ke z.
exercise=β0+β1age+β2weight+β3height+β4male+β5work+ϕz+εexercise
ϕ≠0E(εexercise)=0
Sebelum melanjutkan, sebuah komentar. Dengan model struktural yang saya maksud, mengikuti konvensi Wooldridge dan Goldberger, model yang didalilkan. Artinya, model yang menyatakan hubungan sebab akibat antara kesehatan dan kovariat Anda. Ini adalah perbedaan utama dan ketidaksepakatan dengan jawaban sebelumnya.
Sekarang, kembali ke masalah yang dihadapi, kondisi 2 adalah apa yang dalam literatur persamaan simultan sebut persamaan bentuk tereduksi , yang tidak lain adalah proyeksi linear dari endogen ke semua variabel eksogen, termasuk z.
Sekarang, tancapkan formulir tereduksi ke model yang dipostulatkan dan Anda akan mendapatkannya
health=α0+α1age+α2weight+α3height+α4male+α5work+δz+ν
dimana
αi=bi+b6βi,∀i∈{1,…,5},
δ=b6ϕ dan
ν=u+b6εexercise. Dengan definisi proyeksi linear,
ν tidak berkorelasi dengan semua variabel penjelas dan karenanya OLS dari persamaan terakhir ini akan menghasilkan estimasi yang konsisten untuk
αi dan
δ, bukan yang mendasarinya
bi dalam model yang benar.
Identifikasi memerlukan sedikit manipulasi dalam bentuk matriks tetapi pada dasarnya ia mengurangi kondisi peringkat yang disebut . Menetapkanb =(b0, ... ,b6)′ dan x =(1,age , … , e x e r c i s e)′ sehingga model struktural Anda h e a l th =x′b +u. Sekarang tentukanz ≡(1,age , ... , w o r k , z)′. Dengan kondisi 1 (cov (z, u) = 0 sehingga E (z, u) = 0),
E ( z u)=0
Jika Anda mengalikan sisi sisi model struktural dengan
z dan ambil harapan yang Anda miliki
E ( zx′) b = E ( z y)
Kondisi peringkat menyatakan itu
E ( zx′)adalah peringkat kolom penuh. Dalam contoh khusus ini dan kondisi yang diberikan pada z ini setara dengan
r a n k ( E ( zx′) = 6. Karenanya kita memiliki 6 persamaan dalam 6 yang tidak diketahui. Oleh karena itu ada solusi unik untuk sistem yaitu
b diidentifikasi dan sama dengan
[ E ( zx′)]- 1E ( zy), seperti yang diinginkan.
Keterangan: Kondisi 1 berguna untuk mendapatkan kondisi momen tetapi dengan model formulir tereduksi ϕsangat penting untuk kondisi peringkat. Kedua kondisi itu biasa.
Pada titik ini harus jelas mengapa kita membutuhkan ini. Di satu sisi, tanpa penaksir OLS dari model sebenarnya akan menghasilkan penaksir tidak konsisten tidak hanya untukb6 tapi untuk semua bsaya. Di sisi lain (dan agak terkait), parameter kami diidentifikasi secara unik sehingga kami yakin bahwa kami memperkirakan hubungan sebab akibat yang sebenarnya seperti yang dinyatakan dalam model kami yang sebenarnya.
Sehubungan dengan pengujian, kondisi 2 (z dan olahraga sebagian berkorelasi) dapat diuji secara langsung dan Anda harus selalu melaporkan langkah yang bertentangan dengan komentar pada jawaban sebelumnya. Ada literatur besar sehubungan dengan langkah ini, khususnya literatur instrumen lemah.
Kondisi kedua tidak dapat diuji secara langsung. Kadang-kadang Anda mungkin menggunakan teori ekonomi untuk membenarkan atau memberikan hipotesis alternatif yang mendukung penggunaan z.