Identifikasi kausal dan splines yang dihukum

Saya baru saja mendapat penolakan dari jurnal ekonomi. Di antara alasan yang dikutip untuk penolakan adalah:

manfaat menggunakan metode semi-parametrik tidak jelas dibawa keluar dibandingkan dengan teknik-teknik alternatif yang lebih sederhana dengan identifikasi hubungan kausal yang bersih

Tentu saja mungkin saya bisa melakukan pekerjaan yang lebih baik untuk memotivasi metodologi ini kepada sekelompok ekonom yang umumnya berpegang pada OLS. Tetapi apakah saya melanggar "identifikasi bersih"? Silakan menilai sendiri dan beri tahu saya apa yang Anda pikirkan:

Persamaan estimasi utama saya adalah

y_{i t} = α_{i} + β_{1} T_{i t} + f (\begin{array}{l} Z_{i t} \\ Z_{i t} \times T_{i t} \\ Z_{i t} \times T_{i t} \times X_{t} \end{array}) + β_{2} X_{t} + ϵ_{i t}

$y_{it} = \alpha_i + \beta_1 T_{it} + f\left(\begin{array}{l}Z_{it}\\ Z_{it} \times T_{it} \\ Z_{it}\times T_{it} \times X_t\end{array} \right) + \beta_2X_t + \epsilon_{it}$

Z

$Z$ kontinu,

X

$X$ dan

T

$T$ biner. Saya bisa mengasumsikan itu

E [ϵ | α, T] = 0

$E[\epsilon|\alpha,T] = 0$ Yang mengatakan bahwa koefisien menyala

T

$T$ bersifat tidak bias tergantung pada variabel dummy tingkat individu ("efek tetap" dalam bahasa ekonometrik). Ketika saya memasukkan variabel kontinu

Z

$Z$ , Saya hanya melihat heterogenitas dalam perkiraan efek pengobatan terhadap gradien

Z

$Z$ . Jadi efek kausal rata-rata dari perawatan

T

$T$ adalah rata - rata

{\hat{β}}_{1} + {\hat{f}}_{Z \times T}

$\hat\beta_1 + \hat f_{Z\times T}$ untuk berbagai tingkatan

Z

$Z$ yang saya amati.

Model ini diestimasikan dengan splines kuadratik yang dihukum (misalnya: Ruppert et al. 2003). Secara khusus:

y = β_{0} + X^{'} β + \sum_{1}^{p} (Z^{p})^{'} γ + \sum_{j = 1}^{# v a r s} \sum_{k = 1}^{# k n o t s_{j}} δ_{j k} ({(Z_{j} - κ_{j k})}^{p} \times (Z_{j} > κ_{j k})) + ϵ

$y = \beta_0 +X'\beta + \displaystyle\sum_{1}^p (Z^{p})'\gamma + \displaystyle\sum_{j=1}^{\#vars} \displaystyle\sum_{k=1}^{\# knots_j}\delta_{jk}\left(\left(Z_j - \kappa_{jk} \right)^p \times \left(Z_j > \kappa_{jk} \right)\right) + \epsilon$

Ini diselesaikan oleh

[\begin{matrix} \hat{β} \\ \hat{γ} \\ \hat{δ} \end{matrix}] = (C^{'} C + λ^{2 p} D)^{- 1} C^{'} y

$\left[\begin{array}{c} \hat\beta\\ \hat\gamma \\ \hat \delta \\ \end{array}\right] = (C'C + \lambda^{2p}D)^{-1}C'y$

dimana $C$ termasuk istilah parametrik dan istilah simpul, dan di mana hukuman punggungan $\lambda$ hanya berlaku untuk persyaratan simpanan , dan dipilih untuk meminimalkan AIC. (Saya tidak bisa melakukan keadilan sepenuhnya pada metodologi - lihat Ruppert et al, atau buku teks Simon Wood tentang GAM).

Tentu saja, saya menggunakan semiparametrik ini karena saya tidak ingin memaksakan formulir fungsional yang tidak berdasar pada data saya. Melakukan hal itu akan secara alami membiaskan perkiraan saya sebanyak memaksakan kecocokan logaritmik ke fungsi sinusoidal akan membiaskan perkiraan saya. Tetapi apakah ada sesuatu yang melekat pada splines yang dihukum karena saya telah menggambarkannya yang pada dasarnya akan membuat pernyataan berikut tidak benar?

E [{\hat{β}}_{1}] = β_{1} iff E [ϵ | α, T] = 0

$E[\hat\beta_1] = \beta_1 \text{ iff } E[\epsilon|\alpha,T] = 0$

— generic_user
sumber

Saya tidak memenuhi syarat untuk menjawab pertanyaan terakhir Anda (meskipun tampaknya mencurigakan), tetapi mungkin untuk mengatasi masalah Jurnal Anda juga harus memasukkan model OLS di kertas Anda dan menunjukkan bahwa kinerjanya buruk oleh beberapa metrik?

— thebigdog

Anda tidak melanggar "identifikasi bersih." Tidak ada yang melekat yang membuat model semi-parametrik kurang mampu mencapai identifikasi bersih. Memang, model Anda mencakup model linier.

@generic_user apakah Anda pernah menerima resolusi untuk ini? Jika demikian, dapatkah Anda menjawab pertanyaan Anda? Jika tidak, dapatkah Anda memberikan definisi identifikasi bersih? Saya memiliki beberapa perspektif tentang penerbitan analisis yang disesuaikan spline yang mungkin terkait atau tidak dengan kasus ini.

— AdamO

Terlambat ke pesta, tapi kupikir kau mengkhawatirkan hal yang salah di sini. Wasit mengatakan mereka tidak suka bahwa Anda menambahkan kompleksitas tanpa membuktikan bahwa itu berguna. Contoh yang menunjukkan mode kegagalan dari metode sederhana mereka akan membantu memotivasi kompleksitas tambahan yang Anda perkenalkan. Seharusnya dimungkinkan untuk merekayasa (atau bahkan lebih baik menemukan contoh dunia nyata) di mana splines diperlukan untuk mengidentifikasi hubungan sebab akibat dengan tepat.

— Paul

Jika ini dipublikasikan sebagai poin, bisakah Anda menyebutkan nama makalahnya? Sepertinya aplikasi yang menarik.

— usεr11852

"Identifikasi bersih" parameter regresi bukan konsep yang ditetapkan. Saya percaya apa yang dimaksud oleh pengulas dengan ini adalah bahwa Anda harus menentukan parameter yang dapat diinterpretasikan, diuji, berdimensi rendah, dan yang analisisnya layak diberdayakan untuk mendeteksi sehingga perkiraan yang tidak bias dapat diperoleh dengan efisiensi yang relatif baik.

Keinginan untuk "identifikasi bersih" tidak menyiratkan OLS adalah satu-satunya alat yang cocok untuk pekerjaan itu. OLS, bagaimanapun, adalah alat yang secara teoritis dan praktis terdengar untuk menentukan dan memperkirakan parameter dalam berbagai pengaturan. Keinginan untuk "identifikasi bersih" juga tidak menghalangi inferensi semiparametrik. Sebagai catatan, spline memperluas model OLS dengan membuat (a) representasi kompleks kovariat. Inferensi semiparametrik melibatkan pemodelan yang fleksibel untuk menghilangkan pengaruh statistik tambahan, tetapi dalam model Anda tampaknya paparan utama ditangani sedemikian rupa.

Saya pikir peninjau mengangkat dua keprihatinan yang dibuktikan. Pertama adalah alasan hukuman. Metode regresi yang dihukum berharga untuk prediksi. Mereka jarang digunakan untuk inferensi. Metode hukuman seperti regresi ridge bias, dan sulit untuk menggambarkan atau menilai bias. Tujuan meminimalkan AIC adalah untuk mendapatkan prediksi terbaik, bukan kesimpulan yang valid. Kekhawatiran yang dibuktikan kedua adalah apakah spline bahkan diperlukan untuk memodelkan paparan utama. Memang benar seperti yang Anda katakan bahwa spline mampu memodelkan bentuk fungsional nonlinier kompleks. Namun, spline menyederhanakan sangat sedikit. Ini adalah representasi dimensi tinggi yang kompleks, dengan titik simpul dan penyetelan yang dapat menjadi sumber bias peneliti, dan kovariat yang hampir tidak dapat diinterpretasikan oleh siapa pun kecuali ahli statistik yang sangat terlatih. Banyak tren signifikan secara statistik yang secara tepat dimodelkan oleh splines memiliki pendekatan linier yang mendasari yang tidak signifikan secara statistik maupun praktis.

Jika bentuk fungsional dari paparan utama tidak ditentukan secara spesifik, dimungkinkan untuk menggunakan kesalahan standar Huber White untuk mendapatkan inferensi yang konsisten dan tidak bias untuk kemiringan bujur sangkar terkecil sebagai perkiraan urutan pertama untuk setiap tren non-linear. Splines dapat digunakan untuk memodelkan variabel presisi, di mana Anda tidak mendasarkan inferensi, ketika ada desain yang rumit untuk data. Ini berfungsi untuk secara efektif mencocokkan dan mengurangi variabilitas ketika ada heterogenitas kompleks dalam data.

Saya pikir komentar pengulas dapat diatasi dengan memasang model linier untuk paparan dan melakukan inferensi dengan kesalahan Huber White Sandwich. Jika inferensi sebagian besar setuju dengan inferensi spline, beri komentar pada model spline sejauh ini karena menunjukkan tren lengkung antara eksposur dan respons.

— AdamO
sumber