Bagaimana sebenarnya "model efek acak" dalam ekonometrik berhubungan dengan model campuran di luar ekonometrik?


56

Saya dulu berpikir bahwa "model efek acak" dalam ekonometrik sesuai dengan "model campuran dengan intersep acak" di luar ekonometrik, tetapi sekarang saya tidak yakin. Melakukannya?

Ekonometrik menggunakan istilah-istilah seperti "efek tetap" dan "efek acak" agak berbeda dari literatur pada model campuran, dan ini menyebabkan kebingungan yang terkenal. Mari kita perhatikan situasi sederhana di mana y secara linear tergantung pada x tetapi dengan intersep yang berbeda dalam kelompok pengukuran yang berbeda:

yit=βxit+ui+ϵit.

Di sini setiap unit / kelompok i diamati pada titik waktu yang berbeda t . Ahli ekonometrika menyebutnya "data panel".

  • Dalam terminologi model campuran, kita bisa memperlakukan ui sebagai efek tetap atau sebagai efek acak (dalam hal ini, itu mencegat acak). Memperlakukannya sebagai sarana tetap pas β dan u i untuk meminimalkan kesalahan kuadrat (yaitu menjalankan OLS regresi dengan variabel kelompok dummy). Memperlakukannya secara acak berarti bahwa kita juga mengasumsikan bahwa u iN ( u 0 , σ 2 u ) dan menggunakan kemungkinan maksimum agar sesuai dengan u 0 dan σ 2 u daripada menyesuaikan masing-masing u iβ^u^iuiN(u0,σu2)u0σu2uidengan dirinya sendiri. Ini mengarah ke efek "parsial pooling", di mana perkiraan u i mendapatkan menyusut menuju rata mereka u 0 .u^iu^0

    R formula when treating group as fixed:    y ~ x + group
    R formula when treating group as random:   y ~ x + (1|group)
  • Dalam terminologi ekonometrik, kita dapat memperlakukan keseluruhan model ini sebagai model efek tetap atau sebagai model efek acak. Opsi pertama setara dengan efek tetap di atas (tetapi ekonometrik memiliki cara sendiri untuk memperkirakan β dalam kasus ini, disebut "within" estimator). Dulu saya berpikir bahwa opsi kedua setara dengan efek acak di atas; misal @JiebiaoWang dalam jawaban yang sangat tervotifikasikan untuk Apa perbedaan antara efek acak, efek tetap- dan model marginal? mengatakan itu

    Dalam ekonometrik, model efek-acak hanya dapat merujuk pada model intersep acak seperti pada biostatistik

Oke --- mari kita uji apakah pemahaman ini benar. Berikut adalah beberapa data acak yang dihasilkan oleh @ChristophHanck dalam jawabannya untuk Apa perbedaan antara efek tetap, efek acak dan model efek campuran? (Saya meletakkan data di sini di pastebin untuk mereka yang tidak menggunakan R):

masukkan deskripsi gambar di sini

@Christoph melakukan dua cocok menggunakan pendekatan ekonometrika:

fe <- plm(stackY~stackX, data = paneldata, model = "within")
re <- plm(stackY~stackX, data = paneldata, model = "random")

Yang pertama menghasilkan estimasi beta sama dengan -1.0451, yang kedua 0.77031(ya, positif!). Saya mencoba mereproduksi dengan lmdan lmer:

l1 = lm(stackY ~ stackX + as.factor(unit), data = paneldata)
l2 = lmer(stackY ~ stackX + (1|as.factor(unit)), data = paneldata)

Yang pertama menghasilkan -1.045dalam perjanjian sempurna dengan estimator dalam di atas. Keren. Tetapi hasil kedua -1.026, yang jauh dari penduga efek acak. Heh? Apa yang sedang terjadi? Bahkan, apa yang plmbahkan melakukan , saat dipanggil denganmodel = "random" ?

Apa pun yang dilakukannya, dapatkah seseorang memahaminya melalui perspektif model campuran?

Dan apa intuisi di balik apa pun yang dilakukannya? Saya membaca di beberapa tempat ekonometrik bahwa penaksir efek acak adalah rata-rata tertimbang antara penaksir efek tetap dan "between" estimatoryang lebih atau kurang kemiringan regresi jika kita tidak menyertakan identitas kelompok dalam model sama sekali (perkiraan ini sangat positif dalam hal ini). case, around 4.) Misalnya @Andy menulis di sini :

Estimator efek acak kemudian menggunakan matriks rata-rata tertimbang dari dalam dan di antara variasi data Anda. [...] Ini membuat efek acak lebih efisien [.]

Mengapa? Mengapa kita menginginkan rata-rata tertimbang ini? Dan khususnya, mengapa kita menginginkannya daripada menjalankan model campuran?


8
Wow, 20+ upvotes dan enam jawaban yang mencerahkan dalam waktu kurang dari 24 jam, tetapi semuanya fokus pada sisi ekonometrik pemikiran. Sejauh ini tidak ada jawaban yang menghubungkan ke model campuran.
Amoeba berkata Reinstate Monica


Jawaban:


16

Ringkasan: "model efek-acak" dalam ekonometrik dan "model campuran intersep acak" memang model yang sama, tetapi diperkirakan dengan cara yang berbeda. Cara ekonometrik adalah menggunakan FGLS, dan cara model campuran adalah menggunakan ML. Ada algoritma yang berbeda dalam melakukan FGLS, dan beberapa di antaranya (pada dataset ini) menghasilkan hasil yang sangat dekat dengan ML.


1. Perbedaan antara metode estimasi dalam plm

Saya akan menjawab dengan pengujian saya plm(..., model = "random")dan lmer(), menggunakan data yang dihasilkan oleh @ChristophHanck.

Menurut manual paket plm , ada empat opsi untuk random.method: metode estimasi untuk komponen varians dalam model efek acak. @amoeba menggunakan yang standar swar(Swamy dan Arora, 1972).

Untuk model efek acak, empat penduga parameter transformasi tersedia dengan menyetel metode acak ke salah satu dari "swar" (Swamy dan Arora (1972)) (default), "amemiya" (Amemiya (1971)), "walhus" ( Wallace dan Hussain (1969)), atau "nerlove" (Nerlove (1971)).

Saya menguji keempat opsi menggunakan data yang sama, mendapatkan kesalahanamemiya , dan tiga estimasi koefisien yang sama sekali berbeda untuk variabel stackX. Yang dari menggunakan random.method='nerlove'dan 'amemiya' hampir setara dengan dari lmer(), -1.029 dan -1.025 vs -1.026. Mereka juga tidak jauh berbeda dari yang diperoleh dalam model "efek tetap", -1,045.

# "amemiya" only works using the most recent version:
# install.packages("plm", repos="http://R-Forge.R-project.org")

re0 <- plm(stackY~stackX, data = paneldata, model = "random") #random.method='swar'
re1 <- plm(stackY~stackX, data = paneldata, model = "random",  random.method='amemiya')
re2 <- plm(stackY~stackX, data = paneldata, model = "random",  random.method='walhus')
re3 <- plm(stackY~stackX, data = paneldata, model = "random",  random.method='nerlove')
l2  <- lmer(stackY~stackX+(1|as.factor(unit)), data = paneldata)

coef(re0)     #    (Intercept)   stackX    18.3458553   0.7703073 
coef(re1)     #    (Intercept)   stackX    30.217721   -1.025186 
coef(re2)     #    (Intercept)   stackX    -1.15584     3.71973 
coef(re3)     #    (Intercept)   stackX    30.243678   -1.029111 
fixef(l2)     #    (Intercept)   stackX    30.226295   -1.026482 

Sayangnya saya tidak punya waktu sekarang, tetapi pembaca yang tertarik dapat menemukan empat referensi, untuk memeriksa prosedur estimasi mereka. Akan sangat membantu untuk mencari tahu mengapa mereka membuat perbedaan seperti itu. Saya berharap bahwa untuk beberapa kasus, plmprosedur estimasi menggunakan lm()on transformed data harus setara dengan prosedur kemungkinan maksimum yang digunakan di lmer().

2. Perbandingan antara GLS dan ML

Para penulis plmpaket membandingkan keduanya di Bagian 7 dari makalah mereka: Yves Croissant dan Giovanni Millo, 2008, Panel Data Econometrics dalam R: Paket plm .

Ekonometrika sebagian besar berurusan dengan data non-eksperimental. Penekanan besar diberikan pada prosedur spesifikasi dan pengujian spesifikasi yang salah. Oleh karena itu spesifikasi model cenderung sangat sederhana, sementara perhatian besar diberikan pada masalah-masalah endogenitas regressor, struktur ketergantungan dalam kesalahan dan kekokohan estimator di bawah penyimpangan dari normalitas. Pendekatan yang disukai sering semi atau non-parametrik, dan teknik heteroskedastisitas-konsisten menjadi praktik standar baik dalam estimasi dan pengujian.

Untuk semua alasan ini, [...] estimasi model panel dalam ekonometrik sebagian besar dilakukan dalam kerangka kuadrat terkecil umum berdasarkan pada Teorema Aitken [...]. Sebaliknya, model data longitudinal di nlmedanlme4 diperkirakan dengan kemungkinan maksimum (terbatas atau tidak terbatas). [...]

Pendekatan GLS ekonometrik memiliki solusi analitik bentuk-tertutup yang dapat dihitung dengan aljabar linier standar dan, meskipun yang terakhir kadang-kadang bisa menjadi sangat berat secara komputasi pada mesin, ekspresi untuk estimator biasanya agak sederhana. Estimasi ML model longitudinal, sebaliknya, didasarkan pada optimasi numerik fungsi nonlinier tanpa solusi bentuk-tertutup dan dengan demikian tergantung pada pendekatan dan kriteria konvergensi.


3. Pembaruan pada model campuran

Saya menghargai bahwa @ChristophHanck memberikan pengantar menyeluruh tentang keempat yang random.methoddigunakan plmdan menjelaskan mengapa perkiraan mereka sangat berbeda. Seperti yang diminta oleh @amoeba, saya akan menambahkan beberapa pemikiran tentang model campuran (berbasis kemungkinan) dan hubungannya dengan GLS.

Metode berbasis kemungkinan biasanya mengasumsikan distribusi untuk efek acak dan istilah kesalahan. Asumsi distribusi normal umumnya digunakan, tetapi ada juga beberapa studi dengan asumsi distribusi tidak normal. Saya akan mengikuti notasi @ ChristophHanck untuk model intersep acak, dan memungkinkan data tidak seimbang, yaitu, biarkan .T=ni

Modelnya adalah dengan η iN ( 0 , σ 2 η ) , ϵ i tN ( 0 , σ 2 ϵ ) .

yit=xitβ+ηi+ϵiti=1,,m,t=1,,ni
ηiN(0,ση2),ϵitN(0,σϵ2)

Untuk setiap , y iN ( X i β , Σ i ) ,i Jadi fungsi log-likelihood adalahconst-1

yiN(Xiβ,Σi),Σi=ση21ni1ni+σϵ2Ini.
const12ilog|Σi|12i(yiXiβ)Σi1(yiXiβ).

Ketika semua varian yang dikenal, seperti yang ditunjukkan pada Laird dan Ware (1982), yang MLE adalah β = ( Σ i X yang setara dengan GLS β REyang diperoleh @ChristophHanck. Jadi perbedaan utama adalah dalam estimasi untuk varian. Mengingat bahwa tidak ada solusi bentuk tertutup, ada beberapa pendekatan:

β^=(iXiΣi1Xi)1(iXiΣi1yi),
β^RE
  • langsung memaksimalkan fungsi log-likelihood menggunakan algoritma optimisasi;
  • Algoritma Expectation-Maximization (EM): solusi bentuk-tertutup ada, tetapi estimator untuk melibatkan estimasi empiris Bayesian dari intersep acak;β
  • kombinasi dari dua di atas, Expectation / Conditional Maximization Either (ECME) algoritma (Schafer, 1998; paket R lmm). Dengan parameterisasi yang berbeda, solusi bentuk-tertutup untuk (seperti di atas) dan σβ ada. Solusi untukσ 2 ϵ dapat ditulis sebagaiσ 2 ϵ =1σϵ2σϵ2di manaξdidefinisikan sebagaiσ 2 η /σ 2 ε dan dapat diperkirakan dalam kerangka EM.
    σϵ2=1inii(yiXiβ^)(ξ^1ni1ni+Ini)1(yiXiβ^),
    ξση2/σϵ2

Singkatnya, MLE memiliki asumsi distribusi, dan diperkirakan dalam algoritma iteratif. Perbedaan utama antara MLE dan GLS adalah dalam estimasi varians.

Croissant dan Millo (2008) menunjukkan hal itu

Sementara di bawah normalitas, homoskedastisitas dan tidak ada korelasi serial dari kesalahan OLS juga merupakan penaksir kemungkinan maksimum, dalam semua kasus lain ada perbedaan penting.

Menurut pendapat saya, untuk asumsi distribusi, sama seperti perbedaan antara pendekatan parametrik dan non-parametrik, MLE akan lebih efisien ketika asumsi berlaku, sementara GLS akan lebih kuat.


Saya menduga bahwa masalah dengan pesan kesalahan entah bagaimana terkait dengan saya menghasilkan variabel sebagai vektor? Mungkin saya lebih suka data disimpan secara berbeda?
Christoph Hanck

1
nerloveberfungsi dengan baik di sini, tetapi tidak diterapkan untuk panel tidak seimbang, seperti yang saya temukan dengan menghapus 1 pengamatan dari panel terakhir dan mencoba menjalankan semua metode.
Amoeba berkata Reinstate Monica

2
@ChristophHanck @amoeba The plm Kesalahan random.method="amemiya"terjadi pada saya bahwa mereka mungkin harus menggunakan X[, -1, drop=FALSE]alih-alih X[, -1]mempertahankan format matriks X[, -1]ketika hanya ada satu kovariat dalam model. Lagi pula, saya mencoba mengatasi ini dengan menambahkan variabel normal standar ke rumus. amemiyamereproduksi hasil dengan perkiraan -1,02 dan berfungsi untuk data yang tidak seimbang juga.
Randel

3
@ jiebiao-wang @ChristophHanck @amoeba versi pengembangan saat ini berjalan dengan baik dengan random.method="amemiya": var std.dev berbagi idiosyncratic 0,6360 0,7975 0,002 individu 313,6510 17,7102 0,998 theta:
0,9841

1
Halo @JiebiaoWang. Saya pikir setelah Pembaruan Anda, jawaban Anda menjawab pertanyaan saya dengan memuaskan. Saya mengambil kebebasan untuk mengedit dan memasukkan pembaruan tentang amemiyadan kutipan pada ML vs GLS. Saya menandainya sebagai diterima dan akan menghadiahkannya hadiah. Tepuk tangan.
Amoeba berkata Reinstate Monica

17

Jawaban ini tidak mengomentari model campuran, tapi saya bisa menjelaskan apa yang dilakukan penaksir efek-acak dan mengapa ia gagal pada grafik itu.

Ringkasan: estimator efek-acak mengasumsikan E[uix]=0 , yang tidak benar dalam contoh ini.


Apa yang dilakukan pengukur efek acak?

Asumsikan kita memiliki model:

yit=βxit+ui+ϵit

Kami memiliki dua dimensi variasi: grup i dan waktut . Untuk memperkirakanβ kita dapat:

  1. Hanya gunakan variasi deret waktu dalam grup. Inilah yang dilakukan oleh estimator efek tetap (dan inilah sebabnya ia juga sering disebut estimator dalam.)
  2. Jika ui adalah acak, kita hanya bisa menggunakan variasi cross-sectional antara rata-rata deret waktu kelompok. Ini dikenal sebagaiestimatorantara.

    Secara khusus, untuk setiap kelompok i , ambil rata-rata dari waktu ke waktu model data panel di atas untuk mendapatkan:

    y¯i=βx¯i+vi where vi=ui+ϵ¯i

    Jika kami menjalankan regresi ini, kami mendapatkan estimator. Amati bahwa itu adalah estimator yang konsisten jika efek ui adalah acak white noise, tidak berkorelasi dengan x ! Jika ini masalahnya, maka benar-benar melemparkan variasi antara kelompok (seperti yang kita lakukan dengan penaksir efek tetap) tidak efisien.

Estimator efek-acak dari ekonometrika menggabungkan (1) di dalam estimator (yaitu estimasi efek tetap) dan (2) antara estimator dengan cara untuk memaksimalkan efisiensi. Ini adalah aplikasi kuadrat terkecil yang digeneralisasi dan ide dasarnya adalah pembobotan varians terbalik . Untuk memaksimalkan efisiensi, estimator efek-acak menghitungβ^

Apa yang terjadi dalam grafik itu ...

Hanya dengan melihat grafik itu, Anda dapat dengan jelas melihat apa yang terjadi:

  • ixityit
  • ix¯iui

E[uix]=0uixx

E[uix]=0E[uix]=0β^

Kemudian, penaksir efek-acak tidak aktif karena merupakan rata-rata tertimbang dari penaksir dalam dan di antara penaksir.


+1, terima kasih Matthew. Tidak yakin mengapa seseorang menurunkan jawaban Anda. Saya mencari jawaban untuk membuat koneksi ke model campuran jadi saya tidak akan menerima Anda, tetapi saya masih merasa terbantu untuk diskusi ini. Jika Anda dapat memperluas sedikit tentang bagaimana GLS dan pembobotan varians terbalik diterapkan dan dihitung di sini, itu akan sangat berguna.
Amoeba berkata Reinstate Monica

16

Dalam jawaban ini, saya ingin menguraikan sedikit pada jawaban +1 Matthew mengenai perspektif GLS tentang apa yang disebut literatur ekonometrik sebagai penaksir efek acak.

Perspektif GLS

yit=α+Xitβ+uiti=1,,m,t=1,,T
E(uit|Xit)=0n=mT

uit

uit=ηi+ϵit

y=αιmT+Xβ+Dη+ϵ
yϵnyitϵitDn×mDiDii=1,,m

E(ϵϵ)=σϵ2I

ηϵit

E(ηi|X)=0
ηiση2

Var(uit)=ση2+σϵ2Cov(uit,uis)=ση2Cov(uit,ujs)=0for all ij

n×nΩ

Ω=(ΣOOOΣOOOΣ)
Σ=ση2ιι+σϵ2IT
ιT
Ω=ση2(Imιι)+σϵ2(ImIT)
β^RE=(XΩ1X)1XΩ1y
Ω1JT=ιιJ¯T=JT/TET=ITJ¯T
Ω=Tση2(ImJ¯T)+σϵ2(ImET)+σϵ2(ImJ¯T)
Ω=(Tση2+σϵ2)(ImJ¯T)+σϵ2(ImET)
P=ImJ¯TQ=ImET
Ω1=1σ12P+1σϵ2Q=ση2σ12σϵ2(Imιι)+1σϵ2(ImIT),
σ12=Tση2+σϵ2

ηi

(yitθy¯i)=(XitθX¯i)β+(uitθui),
θ=1ση/σ1θ=1θθ=0

GLS layak

σ12σϵ2

uit

σ^12=T1mi=1mu¯i2
σ^ϵ2=1m(T1)i=1mt=1T(uit1mi=1mu¯i)2
u¯ii

u

iηi=0α^=y¯X¯β^FEitu^=yα^Xβ^FE

σ^ϵ2=[yQ(IX(XQX)1XQ)y]/[m(T1)K]
σ^12=[yP(IZ(ZPX)1ZP)y]/[mK1]
Z=(ιmTX)

ση2i=1m(η^iη^¯)2/(m1)η^iσ^ϵ2mT

Saya juga sangat terkejut bahwa ini membuat perbedaan besar seperti yang ditunjukkan oleh perhitungan Randel!

SUNTING:

plmβamemiya

> ercomp(stackY~stackX, data = paneldata, method = "walhus")
                  var std.dev share
idiosyncratic 21.0726  4.5905 0.981
individual     0.4071  0.6380 0.019
theta:  0.06933  
> ercomp(stackY~stackX, data = paneldata, method = "swar")
                 var std.dev share
idiosyncratic 0.6437  0.8023 0.229
individual    2.1732  1.4742 0.771
theta:  0.811  
> ercomp(stackY~stackX, data = paneldata, method = "nerlove")
                   var  std.dev share
idiosyncratic   0.5565   0.7460 0.002
individual    342.2514  18.5000 0.998
theta:  0.9857  

X

Jika Anda mengganti fitur "menyinggung" dari contoh itu,

alpha = runif(n,seq(0,step*n,by=step),seq(step,step*n+step,by=step))

hanya dengan mengatakan,

alpha = runif(n)

Xββ=1


Referensi

Amemiya, T., 1971, Estimasi varians dalam model varians-komponen , International Economic Review 12, 1-13.

Baltagi, BH, Analisis Ekonometrik Data Panel, Wiley.

Nerlove, M., 1971a, Bukti lebih lanjut tentang estimasi hubungan ekonomi yang dinamis dari serangkaian waktu penampang , Econometrica 39, 359-382.

Swamy, PAVB dan SS Arora, 1972, Properti sampel hingga tepat dari estimator koefisien dalam model regresi komponen kesalahan , Econometrica 40, 261-275.

Wallace, TD dan A. Hussain, 1969, Penggunaan model komponen kesalahan dalam menggabungkan data cross-section dan time-series , Econometrica 37, 55-72.


4
+1. Terima kasih Christoph, ini sangat membantu dan saya senang akhirnya bisa melihat beberapa rincian matematis di utas ini. Akan sangat bagus untuk melihat bagaimana keempat metode yang diterapkan plmdan terdaftar oleh Randel bekerja dan memperbarui jawaban Anda dengan beberapa komentar tentangnya. Jika bukan uraian terperinci, maka setidaknya beberapa catatan singkat tentang apa yang sedang terjadi. Apakah Anda pikir Anda akan dapat mencarinya? Saya senang menawarkan hadiah untuk itu :-) Pendekatan naif saya akan memperkirakan kedua sigma dari solusi efek tetap. Apakah itu sesuai dengan salah satu metode "bernama"?
Amoeba berkata Reinstate Monica

@amoeba, saya menyertakan beberapa komentar tentang cara memperkirakan varians dalam model komponen kesalahan. Saran Anda kemudian tampaknya terkait erat dengan Amemiya.
Christoph Hanck

σϵση

ση2(σ^12σ^ϵ2)/T

1
Ω1lmer

11

N=iTi

Berikut adalah beberapa Stata yang menunjukkan kesetaraan (memerlukan esttabdan eststodari SSC):

set more off
estimates clear
webuse nlswork, clear
eststo, title(mixed): mixed ln_w grade age c.age#c.age ttl_exp tenure c.tenure#c.tenure || id: // Mixed estimator
eststo, title(MLE): xtreg ln_w grade age c.age#c.age ttl_exp tenure c.tenure#c.tenure, i(id) mle // MLE RE estimator 
eststo, title(GLS): xtreg ln_w grade age c.age#c.age ttl_exp tenure c.tenure#c.tenure, i(id) re // GLS RE estimato
esttab *, b(a5) se(a5) mtitle 

Inilah output dari baris terakhir:

. esttab *, b(a5) se(a5) mtitle 

------------------------------------------------------------
                      (1)             (2)             (3)   
                    mixed             MLE             GLS   
------------------------------------------------------------
main                                                        
grade            0.070790***     0.070790***     0.070760***
              (0.0017957)     (0.0017957)     (0.0018336)   

age              0.031844***     0.031844***     0.031906***
              (0.0027201)     (0.0027202)     (0.0027146)   

c.age#c.age   -0.00065130***  -0.00065130***  -0.00065295***
             (0.000044965)    (0.000044971)    (0.000044880)   

ttl_exp          0.035228***     0.035228***     0.035334***
              (0.0011382)     (0.0011392)     (0.0011446)   

tenure           0.037134***     0.037134***     0.037019***
              (0.0015715)     (0.0015723)     (0.0015681)   

c.tenure#c~e   -0.0018382***   -0.0018382***   -0.0018387***
             (0.00010128)    (0.00010128)    (0.00010108)   

_cons             0.14721***      0.14721***      0.14691** 
               (0.044725)      (0.044725)      (0.044928)   
------------------------------------------------------------
lns1_1_1                                                    
_cons            -1.31847***                                
               (0.013546)                                   
------------------------------------------------------------
lnsig_e                                                     
_cons            -1.23024***                                
              (0.0046256)                                   
------------------------------------------------------------
sigma_u                                                     
_cons                             0.26754***                
                              (0.0036240)                   
------------------------------------------------------------
sigma_e                                                     
_cons                             0.29222***                
                              (0.0013517)                   
------------------------------------------------------------
N                   28099           28099           28099   
------------------------------------------------------------
Standard errors in parentheses
* p<0.05, ** p<0.01, *** p<0.001

Dalam data Anda, asumsi untuk menggunakan estimator RE tidak puas karena efek grup berkorelasi jelas dengan x, sehingga Anda mendapatkan perkiraan yang sangat berbeda. Estimator GLS RE sebenarnya adalah metode generalisasi saat (GMM) estimator yang merupakan rata-rata pembobotan matriks antara dan di dalam estimator. Estimator dalam akan baik-baik saja di sini, tetapi di antara keduanya akan sangat kacau, menunjukkan efek positif besar X. Jadi GLS akan sebagian besar antara estimator. MLE RE adalah MLE yang memaksimalkan kemungkinan model efek-acak. Mereka tidak lagi diharapkan untuk menghasilkan jawaban yang sama. Di sini estimator campuran memberikan sesuatu yang sangat dekat dengan estimator FE "Within":

. esttab *, b(a5) se(a5) mtitle 

----------------------------------------------------------------------------
                      (1)             (2)             (3)             (4)   
                    mixed             GLS             MLE          Within   
----------------------------------------------------------------------------
main                                                                        
x                -1.02502***      0.77031**       3.37983***     -1.04507***
               (0.092425)       (0.26346)       (0.20635)      (0.093136)   

_cons             30.2166***      18.3459***      0.49507         30.3492***
                (5.12978)       (2.31566)             (.)       (0.62124)   
----------------------------------------------------------------------------
lns1_1_1                                                                    
_cons             2.87024***                                                
                (0.20498)                                                   
----------------------------------------------------------------------------
lnsig_e                                                                     
_cons            -0.22598**                                                 
               (0.077195)                                                   
----------------------------------------------------------------------------
sigma_u                                                                     
_cons                                             2.40363                   
                                                (1.28929)                   
----------------------------------------------------------------------------
sigma_e                                                                     
_cons                                             4.23472***                
                                                (0.37819)                   
----------------------------------------------------------------------------
N                      96              96              96              96   
----------------------------------------------------------------------------
Standard errors in parentheses
* p<0.05, ** p<0.01, *** p<0.001

Berikut adalah kode Stata untuk tabel di atas:

clear
set more off
estimates clear

input int(obs id t) double(y x)
1      1           1  2.669271  0.5866982
2      1           2  1.475540  1.3500454
3      1           3  4.430008  0.6830919
4      1           4  2.162789  0.5845966
5      1           5  2.678108  1.0038879
6      1           6  3.456636  0.5863289
7      1           7  1.769204  2.3375403
8      1           8  3.413790  0.9640034
9      2           1  4.017493  1.5084121
10     2           2  4.218733  2.8982499
11     2           3  4.509530  3.2141335
12     2           4  6.106228  2.0317799
13     2           5  5.161379  2.1231733
14     2           6  2.724643  4.3369017
15     2           7  4.500306  1.9141065
16     2           8  4.119322  2.8667938
17     3           1  9.987779  2.3961969
18     3           2  7.768579  3.5509275
19     3           3  9.379788  3.3284869
20     3           4 10.035937  2.2997389
21     3           5 11.752360  2.8143474
22     3           6  9.500264  2.1825704
23     3           7  8.921687  5.0126462
24     3           8  8.269932  3.4046339
25     4           1 12.101253  3.2928033
26     4           2 11.482337  3.1645218
27     4           3 10.648010  4.8073987
28     4           4  9.687320  5.3394193
29     4           5 12.796925  3.1197431
30     4           6  9.971434  4.6512983
31     4           7 10.239717  4.7709378
32     4           8 12.245207  2.7952426
33     5           1 18.473320  5.8421967
34     5           2 19.097212  4.9425391
35     5           3 19.460495  4.9166172
36     5           4 18.642305  4.9856035
37     5           5 17.723912  5.0594425
38     5           6 16.783248  4.8615618
39     5           7 16.100984  6.2069167
40     5           8 18.851351  3.8856152
41     6           1 19.683171  7.5568816
42     6           2 21.104231  6.7441900
43     6           3 22.115529  6.4486514
44     6           4 22.061362  5.3727434
45     6           5 22.457905  5.8665798
46     6           6 21.424413  6.0578997
47     6           7 23.475946  4.4024323
48     6           8 24.884950  4.1596914
49     7           1 25.809011  7.6756255
50     7           2 25.432828  7.7910756
51     7           3 26.790387  7.3858301
52     7           4 24.640850  8.2090606
53     7           5 26.050086  7.3779219
54     7           6 25.297148  6.8098617
55     7           7 26.551229  7.6694272
56     7           8 26.669760  6.4425772
57     8           1 26.409669  8.3040894
58     8           2 26.570003  8.4686087
59     8           3 29.018818  7.2476785
60     8           4 30.342613  4.5207729
61     8           5 26.819959  8.7935557
62     8           6 27.147711  8.3141224
63     8           7 26.168568  9.0148308
64     8           8 27.653552  8.2081808
65     9           1 34.120485  7.8415520
66     9           2 31.286463  9.7234259
67     9           3 35.763403  6.9202442
68     9           4 31.974599  9.0078286
69     9           5 32.273719  9.4954288
70     9           6 29.666208 10.2525763
71     9           7 30.949857  9.4751679
72     9           8 33.485967  8.1824810
73    10           1 36.183128 10.7891587
74    10           2 37.706116  9.7119548
75    10           3 38.582725  8.6388290
76    10           4 35.876781 10.8259279
77    10           5 37.111179  9.9805046
78    10           6 40.313149  7.7487456
79    10           7 38.606329 10.2891107
80    10           8 37.041938 10.3568765
81    11           1 42.617586 12.1619185
82    11           2 41.787495 11.1420338
83    11           3 43.944968 11.1898730
84    11           4 43.446467 10.8099599
85    11           5 43.420819 11.2696770
86    11           6 42.367318 11.6183869
87    11           7 43.543785 11.1336555
88    11           8 43.750271 12.0311065
89    12           1 46.122429 12.3528733
90    12           2 47.604306 11.4522787
91    12           3 45.568748 13.6906476
92    12           4 48.331177 12.3561907
93    12           5 47.143246 11.7339915
94    12           6 44.461190 13.3898768
95    12           7 46.879044 11.4054972
96    12           8 46.314055 12.3143487
end

eststo, title(mixed): mixed y x || id:, mle // Mixed estimator
eststo, title(GLS): xtreg y x, i(id) re     // GLS RE estimato
eststo, title(MLE): xtreg y x, i(id) mle    // MLE RE estimator 
eststo, title(Within): xtreg y x, i(id) fe  // FE Within estimator 
eststo, title(Between): xtreg y x, i(id) be // Between estimator 

esttab *, b(a5) se(a5) mtitle 

+1. Terima kasih, Dimitriy, sangat membantu melihat output Stata pada dataset mainan yang sama. Saya punya pertanyaan tentang penaksir MLE. Saya berpikir bahwa pendekatan model campuran ( mixeddi Stata dan lmerdi R) juga kemungkinan maksimum atau kadang-kadang "kemungkinan maksimum terbatas" (Saya dapat menggunakan keduanya dalam lmerpanggilan saya dengan mengatur REML=Tatau REML=Fdan mereka memberikan hasil yang hampir identik). Namun pendekatan model campuran memberikan hasil yang sangat masuk akal dan benar, sedangkan apa panggilan Stat "MLE" memberikan hasil omong kosong dalam kasus ini. Apa bedanya? Apa sebenarnya yang dimaksud dengan Stat "MLE"?
Amoeba berkata Reinstate Monica

2
@amoeba Keduanya mixed, mledan xtreg, mlemerupakan penaksir MLE, tetapi fungsi kemungkinannya agak berbeda. Lihat di sini untuk yang pertama, dan di sini untuk yang terakhir. Saya tidak begitu mengerti mengapa mixedmodelnya begitu kuat.
Dimitriy V. Masterov

xtmixed adalah apa yang disebut campuran dalam versi lama Stata. Untuk data Anda, kesetaraan itu jelas tidak berlaku, sementara itu berlaku untuk data saya, seperti yang disarankan oleh manual.
Dimitriy V. Masterov

ssc install estoutMeskipun ingatan saya adalah bahwa ia memiliki fungsi yang berbeda di versi yang berbeda, dan gagal menjadi kompatibel.
Tugas

1
@StasK menghubungkan saya dengan dukungan teknis Stata dan mereka mengatakan kemungkinan ada bug di dalamnya xtreg, mle. "Secara umum hasilnya harus sama [...]. Perbedaan semacam ini biasanya muncul ketika ada masalah identifikasi dalam estimasi parameter model. [...] Saya benar-benar memeriksa nomor kondisi untuk varian. -covariance matrix yang dihasilkan dari kedua komputasi dan angka itu pada dasarnya tidak terbatas untuk -xtreg, mle- dan lebih dari 4000 untuk -mixed, mle-. [...] para pengembang [...] akan mengevaluasi masalah untuk menentukan apakah kode tetap diperlukan. "
Amoeba berkata Reinstate Monica

9

Biarkan saya lebih membingungkan:


αsaya

αsaya

Diskusi (sebagian dikutip dari catatan kelas)

"Keuntungan utama dari pendekatan efek tetap adalah bahwa kita tidak perlu membuat asumsi tentang sifat dari efek individu. Kita harus menerapkannya setiap kali kita menduga bahwa yang terakhir berkorelasi dengan satu atau lebih dari para regressor karena dalam kasus ini mengabaikan adanya korelasi seperti itu dan secara naif menerapkan OLS pada model yang dikumpulkan menghasilkan estimator yang tidak konsisten.Meskipun mengajukan banding atas dasar asumsi minimal yang perlu kita buat mengenai efek individu, pendekatan efek tetap memiliki batasan tertentu. Pertama, koefisien waktu regresor invarian tidak dapat diperkirakan karena variabel-variabel ini dibedakan bersama dengan efek individu yang tidak dapat diobservasi.efek individual (jika kita menggunakan penduga LSDV) tidak dapat diperkirakan secara konsisten (kecuali jika kita membiarkan dimensi waktu menjadi tak terbatas). "


αsaya

Dalam ekstensi yang menarik, keacakan tambahan muncul dari keberadaan efek waktu acak , umum untuk semua bagian lintas tetapi waktu bervariasi , di samping efek individu tetap (konstan) dan istilah kesalahan. "Efek waktu" ini misalnya dapat mewakili kejutan agregat pada tingkat ekonomi yang memengaruhi semua rumah tangga secara setara. Gangguan agregat seperti itu memang diamati dan tampaknya menjadi pilihan pemodelan yang realistis.

Di sini Estimator "Efek Acak" adalah estimator Generalized Least Squares (GLS), untuk meningkatkan efisiensi.

Sekarang, satu lagi estimator yang dikandung, Estimator "Antara", melakukan OLS pada pengamatan rata-rata waktu. Sebagai soal aljabar, telah ditunjukkan bahwa penaksir GLS dapat diperoleh sebagai rata-rata tertimbang penaksir Dalam dan Antar, di mana bobot tidak sembarangan tetapi berhubungan dengan matriks VCV dari keduanya.

... dan ada juga varian "Uncorrelated Random Effects" dan "Correlated Random Effects" model.

Saya harap bantuan di atas membuat kontras dengan model "efek campuran".


+1, terima kasih Alecos. Ini membantu, tetapi hubungan semua itu dengan pendekatan model campuran masih belum jelas bagi saya. Saya mulai curiga bahwa mungkin tidak ada hubungan sama sekali. Estimasi antara dan di dalam (dan bahwa di dalam setara dengan kelas boneka) jelas dengan cara; kebingungan saya hanya tentang pendekatan efek acak.
Amuba kata Reinstate Monica
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.