Pengaturan
Misalkan Anda memiliki regresi sederhana dari bentuk
mana hasilnya adalah pendapatan log orang i , S i adalah jumlah tahun sekolah, dan ϵ i
dalamysaya= α + βSsaya+ ϵsaya
sayaSsayaϵsaya adalah istilah kesalahan. Alih-alih hanya melihat efek rata-rata pendidikan terhadap pendapatan, yang akan Anda dapatkan melalui OLS, Anda juga ingin melihat efeknya di berbagai bagian distribusi hasil.
1) Apa perbedaan antara pengaturan kondisional dan tanpa syarat
Pertama plot pendapatan log dan mari kita memilih dua individu, dan B , di mana A berada di bagian bawah dari distribusi pendapatan tanpa syarat dan BSEBUAHBSEBUAHB di bagian atas.
Itu tidak terlihat sangat normal tapi itu karena saya hanya menggunakan 200 pengamatan dalam simulasi, jadi jangan pedulikan itu. Sekarang apa yang terjadi jika kita mengkondisikan penghasilan kita pada tahun-tahun pendidikan? Untuk setiap tingkat pendidikan Anda akan mendapatkan distribusi pendapatan "bersyarat", yaitu Anda akan menghasilkan plot kepadatan seperti di atas tetapi untuk setiap tingkat pendidikan secara terpisah.
SEBUAHBSEBUAH cukup baik di antara pir-nya dalam kurun waktu 5 tahun pendidikan, maka ia berada di persentil ke-90.
Jadi begitu Anda mengkondisikan pada variabel lain, kini telah terjadi bahwa satu orang sekarang berada di bagian atas dari distribusi bersyarat sedangkan orang itu akan berada di bagian bawah dari distribusi tanpa syarat - inilah yang mengubah penafsiran koefisien regresi kuantil . Mengapa?
E[ ysaya| Ssaya] = E[ ysaya]Qτ( ysaya| Ssaya) ≠ Qτ( ysaya)τ. Ini dapat diselesaikan dengan terlebih dahulu melakukan regresi kuantil kondisional dan kemudian mengintegrasikan variabel-variabel pengkondisian untuk mendapatkan efek yang terpinggirkan (efek tanpa syarat) yang dapat Anda interpretasikan seperti dalam OLS. Contoh dari pendekatan ini disediakan oleh Powell (2014) .
2) Bagaimana menafsirkan koefisien regresi kuantil?
Ini adalah bagian yang sulit dan saya tidak mengklaim memiliki semua pengetahuan di dunia tentang hal ini, jadi mungkin seseorang memberikan penjelasan yang lebih baik untuk ini. Seperti yang Anda lihat, peringkat individu dalam distribusi pendapatan bisa sangat berbeda untuk apakah Anda mempertimbangkan distribusi kondisional atau tanpa syarat.
β90= 0,13
Untuk regresi kuantil tanpa syarat
Itu seperti koefisien OLS yang biasa Anda tafsirkan. Kesulitan di sini bukanlah interpretasi tetapi bagaimana mendapatkan koefisien-koefisien yang tidak selalu mudah (integrasi mungkin tidak berfungsi, misalnya dengan data yang sangat jarang). Cara lain untuk memarjinalkan koefisien regresi kuantil tersedia seperti metode Firpo (2009) menggunakan fungsi pengaruh terpusat. Buku oleh Angrist dan Pischke (2009) yang disebutkan dalam komentar menyatakan bahwa marginalisasi koefisien regresi kuantil masih merupakan bidang penelitian aktif dalam ekonometrik - meskipun sejauh yang saya tahu kebanyakan orang saat ini puas dengan metode integrasi (contohnya adalah Melly dan Santangelo (2015) yang menerapkannya pada model Changes-in-Changes).
3) Apakah koefisien regresi kuantitatif bersyarat bias?
Tidak (dengan asumsi Anda memiliki model yang ditentukan dengan benar), mereka hanya mengukur sesuatu yang berbeda yang Anda mungkin atau mungkin tidak tertarik. Efek yang diperkirakan pada distribusi daripada individu adalah seperti yang saya katakan tidak terlalu menarik - sebagian besar waktu. Untuk memberikan contoh balasan: pertimbangkan pembuat kebijakan yang memperkenalkan tahun tambahan wajib sekolah dan mereka ingin tahu apakah ini mengurangi ketidaksetaraan pendapatan dalam populasi.
βτβ10= β90= 0,8 , satu tahun tambahan pendidikan akan meningkatkan pendapatan sebesar 8% di seluruh distribusi pendapatan.
Ketika efek perlakuan kuantil TIDAK konstan (seperti pada dua panel bawah), Anda juga memiliki efek skala selain efek lokasi. Dalam contoh ini bagian bawah dari distribusi pendapatan bergeser ke atas lebih dari atas, sehingga perbedaan 90-10 (ukuran standar ketidaksetaraan pendapatan) menurun dalam populasi.
Anda tidak tahu orang mana yang mendapat manfaat dari itu atau di bagian mana dari distribusi orang-orang yang memulai di bagian bawah (untuk menjawab pertanyaan itu Anda memerlukan koefisien regresi kuantil tanpa syarat). Mungkin kebijakan ini menyakiti mereka dan menempatkan mereka di bagian yang lebih rendah dibandingkan dengan yang lain, tetapi jika tujuannya adalah untuk mengetahui apakah satu tahun tambahan pendidikan wajib mengurangi penyebaran pendapatan maka ini informatif. Contoh dari pendekatan semacam itu adalah Brunello et al. (2009) .
Jika Anda masih tertarik pada bias regresi kuantil karena sumber endogenitas, lihat Angrist et al (2006) di mana mereka memperoleh rumus bias variabel yang dihilangkan untuk konteks kuantil.