Apa yang akan menjadi gambaran ilustrasi untuk model campuran linier?


17

Katakan bahwa Anda berada di perpustakaan departemen statistik Anda, dan bahwa Anda menemukan sebuah buku dengan gambar berikut di halaman depan.

masukkan deskripsi gambar di sini

Anda mungkin akan berpikir bahwa ini adalah buku tentang hal-hal regresi linier.

Gambar apa yang akan membuat Anda berpikir tentang model campuran linier?

Jawaban:


12

Untuk ceramah, saya telah menggunakan gambar berikut yang didasarkan pada sleepstudydataset dari paket lme4 . Idenya adalah untuk menggambarkan perbedaan antara kecocokan regresi independen dari data subjek-spesifik (abu-abu) versus prediksi dari model efek-acak, terutama bahwa (1) nilai prediksi dari model efek-acak adalah estimator penyusutan dan (2) lintasan individu berbagi kemiringan umum dengan model intersepsi acak saja (oranye). Distribusi intersepsi subjek ditampilkan sebagai estimasi kepadatan kernel pada sumbu y ( kode R ).

masukkan deskripsi gambar di sini
(Kurva densitas melampaui rentang nilai yang diamati karena hanya ada sedikit pengamatan.)

Grafik yang lebih 'konvensional' mungkin yang berikutnya, yaitu dari Doug Bates (tersedia di situs R-forge untuk lme4 , misalnya 4Longitudinal.R ), di mana kita dapat menambahkan data individual di setiap panel.

masukkan deskripsi gambar di sini


+1. Bagus Saya pikir plot pertama Anda bagus pada tingkat konseptual. Satu-satunya komentar saya adalah bahwa hal itu membutuhkan lebih banyak penjelasan daripada plot "naif" standar dan jika audiens tidak cepat dengan konsep-konsep model LME dan data longitudinal mungkin kehilangan titik plot. Saya pasti akan mengingatnya untuk "statistik bicara" yang solid. (Saya sudah melihat plot kedua dalam "buku lme4" beberapa kali. Saya tidak terlalu terkesan saat itu dan saya juga tidak terlalu terkesan sekarang.)
usεr11852 mengatakan Reinstate Monic

@ chl: Terima kasih! Saya akan memilih di antara proposal. Sementara itu, +1
ocram

@ user11852 Pemahaman saya tentang model RI adalah bahwa perkiraan OLS benar, tetapi kesalahan standar mereka tidak (karena kurangnya kemandirian) sehingga prediksi individu akan salah juga. Biasanya, saya akan menunjukkan garis regresi keseluruhan dengan asumsi pengamatan independen. Kemudian, teori memberi tahu kita bahwa menggabungkan mode kondisional dari efek acak dan perkiraan efek tetap menghasilkan mode kondisional dari koefisien dalam-subjek, dan akan ada sedikit penyusutan ketika unit statistik berbeda, atau ketika pengukuran akurat, atau dengan sampel besar.
chl

y|γN(Xβ+Zγ,σ2saya)yN(Xβ,ZDZT+σ2saya)

Tautan ke kode R untuk membuat gambar rusak. Saya akan tertarik pada cara menggambar distribusi secara vertikal pada gambar.
Niels Hameleers

8

Jadi sesuatu yang tidak "sangat elegan" tetapi menunjukkan penyadapan acak dan lereng juga dengan R. (Saya kira itu akan lebih keren jika jika menunjukkan persamaan aktual juga) masukkan deskripsi gambar di sini

N =100; set.seed(123);


x1 = runif(N)*3; readings1 <- 2*x1 + 1.0 + rnorm(N)*.99;
x2 = runif(N)*3; readings2 <- 3*x2 + 1.5 + rnorm(N)*.99;
x3 = runif(N)*3; readings3 <- 4*x3 + 2.0 + rnorm(N)*.99;
x4 = runif(N)*3; readings4 <- 5*x4 + 2.5 + rnorm(N)*.99;
x5 = runif(N)*3; readings5 <- 6*x5 + 3.0 + rnorm(N)*.99;

X = c(x1,x2,x3,x4,x5);
Y = c(readings1,readings2,readings3,readings4,readings5)
Grouping  = c(rep(1,N),rep(2,N),rep(3,N),rep(4,N),rep(5,N))

library(lme4);
LMERFIT <- lmer(Y ~ 1+ X+ (X|Grouping))

RIaS <-unlist( ranef(LMERFIT)) #Random Intercepts and Slopes
FixedEff <- fixef(LMERFIT)    # Fixed Intercept and Slope

png('SampleLMERFIT_withRandomSlopes_and_Intercepts.png', width=800,height=450,units="px" )
par(mfrow=c(1,2))
plot(X,Y,xlab="x",ylab="readings")
plot(x1,readings1, xlim=c(0,3), ylim=c(min(Y)-1,max(Y)+1), pch=16,xlab="x",ylab="readings" )
points(x2,readings2, col='red', pch=16)
points(x3,readings3, col='green', pch=16)
points(x4,readings4, col='blue', pch=16)
points(x5,readings5, col='orange', pch=16)
abline(v=(seq(-1,4 ,1)), col="lightgray", lty="dotted");        
abline(h=(seq( -1,25 ,1)), col="lightgray", lty="dotted")   

lines(x1,FixedEff[1]+ (RIaS[6] + FixedEff[2])* x1+ RIaS[1], col='black')
lines(x2,FixedEff[1]+ (RIaS[7] + FixedEff[2])* x2+ RIaS[2], col='red')
lines(x3,FixedEff[1]+ (RIaS[8] + FixedEff[2])* x3+ RIaS[3], col='green')
lines(x4,FixedEff[1]+ (RIaS[9] + FixedEff[2])* x4+ RIaS[4], col='blue')
lines(x5,FixedEff[1]+ (RIaS[10]+ FixedEff[2])* x5+ RIaS[5], col='orange') 
legend(0, 24, c("Group1","Group2","Group3","Group4","Group5" ), lty=c(1,1), col=c('black','red', 'green','blue','orange'))
dev.off()

Terima kasih! Saya menunggu sedikit lebih banyak untuk jawaban baru yang potensial ... tapi saya mungkin akan membangun ini.
ocram

Saya agak bingung dengan angka Anda, karena subplot yang tepat terlihat bagi saya seolah-olah garis regresi terpisah cocok untuk masing-masing kelompok. Bukankah seluruh poin yang cocok untuk model campuran harus berbeda dari yang cocok untuk setiap grup? Mungkin memang begitu, tetapi dalam contoh ini sangat sulit untuk diketahui, atau apakah saya kehilangan sesuatu?
Amoeba berkata Reinstate Monica

2
Ya, koefisiennya berbeda . Nggak; regresi terpisah tidak cocok untuk masing-masing kelompok. Cocok bersyarat ditampilkan. Dalam desain homoskedastik yang seimbang sempurna seperti ini perbedaannya akan sulit untuk diperhatikan, misalnya intersep bersyarat grup 5 adalah 2,96 sedangkan intersep per grup independen adalah 3,00. Ini adalah struktur kesalahan kovarians yang Anda ubah. Periksa jawaban chi juga, ia memiliki lebih banyak grup, tetapi bahkan dalam beberapa kasus sangat cocok secara visual.
usεr11852 mengatakan Reinstate Monic

6

Bukan pekerjaanku

Grafik ini diambil dari dokumentasi Matlab tentang nlmefit menurut saya sebagai salah satu contoh yang sangat jelas tentang konsep intersep dan lereng acak. Mungkin sesuatu yang menunjukkan kelompok heteroskedastisitas dalam residu plot OLS juga cukup standar tetapi saya tidak akan memberikan "solusi".


Terima kasih atas saran Anda. Meskipun kelihatannya seperti hal-hal regresi logistik campuran, saya kira saya dapat dengan mudah menyesuaikannya. Saya menunggu saran lainnya. Sementara itu, +1. Terima kasih lagi.
ocram

Itu terlihat seperti regresi logistik campuran terutama karena itu adalah salah satu ... :) Itu adalah plot pertama yang muncul di benak saya benar-benar! Saya akan memberikan sesuatu yang murni R-ish dalam jawaban kedua.
usεr11852 mengatakan Reinstate Monic
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.