Saya dulu berpikir bahwa "model efek acak" dalam ekonometrik sesuai dengan "model campuran dengan intersep acak" di luar ekonometrik, tetapi sekarang saya tidak yakin. Melakukannya?
Ekonometrik menggunakan istilah-istilah seperti "efek tetap" dan "efek acak" agak berbeda dari literatur pada model campuran, dan ini menyebabkan kebingungan yang terkenal. Mari kita perhatikan situasi sederhana di mana secara linear tergantung pada tetapi dengan intersep yang berbeda dalam kelompok pengukuran yang berbeda:
Di sini setiap unit / kelompok diamati pada titik waktu yang berbeda . Ahli ekonometrika menyebutnya "data panel".
Dalam terminologi model campuran, kita bisa memperlakukan sebagai efek tetap atau sebagai efek acak (dalam hal ini, itu mencegat acak). Memperlakukannya sebagai sarana tetap pas β dan u i untuk meminimalkan kesalahan kuadrat (yaitu menjalankan OLS regresi dengan variabel kelompok dummy). Memperlakukannya secara acak berarti bahwa kita juga mengasumsikan bahwa u i ∼ N ( u 0 , σ 2 u ) dan menggunakan kemungkinan maksimum agar sesuai dengan u 0 dan σ 2 u daripada menyesuaikan masing-masing u idengan dirinya sendiri. Ini mengarah ke efek "parsial pooling", di mana perkiraan u i mendapatkan menyusut menuju rata mereka u 0 .
R formula when treating group as fixed: y ~ x + group R formula when treating group as random: y ~ x + (1|group)
- Dalam terminologi ekonometrik, kita dapat memperlakukan keseluruhan model ini sebagai model efek tetap atau sebagai model efek acak. Opsi pertama setara dengan efek tetap di atas (tetapi ekonometrik memiliki cara sendiri untuk memperkirakan dalam kasus ini, disebut
"within" estimator
). Dulu saya berpikir bahwa opsi kedua setara dengan efek acak di atas; misal @JiebiaoWang dalam jawaban yang sangat tervotifikasikan untuk Apa perbedaan antara efek acak, efek tetap- dan model marginal? mengatakan ituDalam ekonometrik, model efek-acak hanya dapat merujuk pada model intersep acak seperti pada biostatistik
Oke --- mari kita uji apakah pemahaman ini benar. Berikut adalah beberapa data acak yang dihasilkan oleh @ChristophHanck dalam jawabannya untuk Apa perbedaan antara efek tetap, efek acak dan model efek campuran? (Saya meletakkan data di sini di pastebin untuk mereka yang tidak menggunakan R):
@Christoph melakukan dua cocok menggunakan pendekatan ekonometrika:
fe <- plm(stackY~stackX, data = paneldata, model = "within")
re <- plm(stackY~stackX, data = paneldata, model = "random")
Yang pertama menghasilkan estimasi beta sama dengan -1.0451
, yang kedua 0.77031
(ya, positif!). Saya mencoba mereproduksi dengan lm
dan lmer
:
l1 = lm(stackY ~ stackX + as.factor(unit), data = paneldata)
l2 = lmer(stackY ~ stackX + (1|as.factor(unit)), data = paneldata)
Yang pertama menghasilkan -1.045
dalam perjanjian sempurna dengan estimator dalam di atas. Keren. Tetapi hasil kedua -1.026
, yang jauh dari penduga efek acak. Heh? Apa yang sedang terjadi? Bahkan, apa yang plm
bahkan melakukan , saat dipanggil denganmodel = "random"
?
Apa pun yang dilakukannya, dapatkah seseorang memahaminya melalui perspektif model campuran?
Dan apa intuisi di balik apa pun yang dilakukannya? Saya membaca di beberapa tempat ekonometrik bahwa penaksir efek acak adalah rata-rata tertimbang antara penaksir efek tetap dan "between" estimator
yang lebih atau kurang kemiringan regresi jika kita tidak menyertakan identitas kelompok dalam model sama sekali (perkiraan ini sangat positif dalam hal ini). case, around 4
.) Misalnya @Andy menulis di sini :
Estimator efek acak kemudian menggunakan matriks rata-rata tertimbang dari dalam dan di antara variasi data Anda. [...] Ini membuat efek acak lebih efisien [.]
Mengapa? Mengapa kita menginginkan rata-rata tertimbang ini? Dan khususnya, mengapa kita menginginkannya daripada menjalankan model campuran?