Dalam buku mereka "Analisis Multilevel: Pengantar Pemodelan Multilevel Dasar dan Lanjutan" (1999), Snijders & Bosker (bab 8, bagian 8.2, halaman 119) mengatakan bahwa korelasi intersep-slope, dihitung sebagai kovarians intersep-slope yang dibagi oleh akar kuadrat dari produk intercept variance dan slope variance, tidak dibatasi antara -1 dan +1 dan bahkan bisa tak terbatas.
Mengingat ini, saya tidak berpikir saya harus mempercayainya. Tapi saya punya contoh untuk diilustrasikan. Dalam salah satu analisis saya, yang memiliki ras (dikotomi), usia dan ras * usia sebagai efek tetap, kohort sebagai efek acak, dan variabel dikotomi ras sebagai kemiringan acak, rangkaian scatterplot saya menunjukkan bahwa kemiringan tidak bervariasi banyak di seluruh nilai. variabel cluster saya (yaitu, kohort), dan saya tidak melihat kemiringan menjadi lebih atau lebih curam di seluruh kohort. Uji Likelihood Ratio juga menunjukkan bahwa kesesuaian antara model mencegat acak dan kemiringan acak tidak signifikan meskipun ukuran sampel total saya (N = 22.156). Namun, korelasi intersep-slope mendekati -0,80 (yang akan menyarankan konvergensi yang kuat dalam perbedaan kelompok dalam variabel Y dari waktu ke waktu, yaitu, lintas kohort).
Saya pikir itu adalah ilustrasi yang baik tentang mengapa saya tidak mempercayai korelasi intersep-slope, di atas apa yang sudah dikatakan Snijders & Bosker (1999).
Haruskah kita benar-benar mempercayai dan melaporkan korelasi intersep-slope dalam studi bertingkat? Secara khusus, apa kegunaan korelasi tersebut?
EDIT 1: Saya tidak berpikir itu akan menjawab pertanyaan saya, tetapi gung meminta saya untuk memberikan informasi lebih lanjut. Lihat di bawah, jika itu membantu.
Data berasal dari Survei Sosial Umum. Untuk sintaks, saya menggunakan Stata 12, jadi berbunyi:
xtmixed wordsum bw1 aged1 aged2 aged3 aged4 aged6 aged7 aged8 aged9 bw1aged1 bw1aged2 bw1aged3 bw1aged4 bw1aged6 bw1aged7 bw1aged8 bw1aged9 || cohort21: bw1, reml cov(un) var
wordsum
adalah skor tes kosa kata (0-10),bw1
adalah variabel etnis (hitam = 0, putih = 1),aged1-aged9
adalah variabel dummy usia,bw1aged1-bw1aged9
adalah interaksi antara etnis dan usia,cohort21
adalah variabel kohort saya (21 kategori, kode 0 hingga 20).
Output berbunyi:
. xtmixed wordsum bw1 aged1 aged2 aged3 aged4 aged6 aged7 aged8 aged9 bw1aged1 bw1aged2 bw1aged3 bw1aged4 bw1aged6 bw1aged7 bw1aged8 bw1aged9 || cohort21: bw1, reml
> cov(un) var
Performing EM optimization:
Performing gradient-based optimization:
Iteration 0: log restricted-likelihood = -46809.738
Iteration 1: log restricted-likelihood = -46809.673
Iteration 2: log restricted-likelihood = -46809.673
Computing standard errors:
Mixed-effects REML regression Number of obs = 22156
Group variable: cohort21 Number of groups = 21
Obs per group: min = 307
avg = 1055.0
max = 1728
Wald chi2(17) = 1563.31
Log restricted-likelihood = -46809.673 Prob > chi2 = 0.0000
------------------------------------------------------------------------------
wordsum | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
bw1 | 1.295614 .1030182 12.58 0.000 1.093702 1.497526
aged1 | -.7546665 .139246 -5.42 0.000 -1.027584 -.4817494
aged2 | -.3792977 .1315739 -2.88 0.004 -.6371779 -.1214175
aged3 | -.1504477 .1286839 -1.17 0.242 -.4026635 .101768
aged4 | -.1160748 .1339034 -0.87 0.386 -.3785207 .1463711
aged6 | -.1653243 .1365332 -1.21 0.226 -.4329245 .102276
aged7 | -.2355365 .143577 -1.64 0.101 -.5169423 .0458693
aged8 | -.2810572 .1575993 -1.78 0.075 -.5899461 .0278318
aged9 | -.6922531 .1690787 -4.09 0.000 -1.023641 -.3608649
bw1aged1 | -.2634496 .1506558 -1.75 0.080 -.5587297 .0318304
bw1aged2 | -.1059969 .1427813 -0.74 0.458 -.3858431 .1738493
bw1aged3 | -.1189573 .1410978 -0.84 0.399 -.395504 .1575893
bw1aged4 | .058361 .1457749 0.40 0.689 -.2273525 .3440746
bw1aged6 | .1909798 .1484818 1.29 0.198 -.1000393 .4819988
bw1aged7 | .2117798 .154987 1.37 0.172 -.0919891 .5155486
bw1aged8 | .3350124 .167292 2.00 0.045 .0071262 .6628987
bw1aged9 | .7307429 .1758304 4.16 0.000 .3861217 1.075364
_cons | 5.208518 .1060306 49.12 0.000 5.000702 5.416334
------------------------------------------------------------------------------
------------------------------------------------------------------------------
Random-effects Parameters | Estimate Std. Err. [95% Conf. Interval]
-----------------------------+------------------------------------------------
cohort21: Unstructured |
var(bw1) | .0049087 .010795 .0000659 .3655149
var(_cons) | .0480407 .0271812 .0158491 .145618
cov(bw1,_cons) | -.0119882 .015875 -.0431026 .0191262
-----------------------------+------------------------------------------------
var(Residual) | 3.988915 .0379483 3.915227 4.06399
------------------------------------------------------------------------------
LR test vs. linear regression: chi2(3) = 85.83 Prob > chi2 = 0.0000
Note: LR test is conservative and provided only for reference.
Plot sebaran yang saya hasilkan ditunjukkan di bawah ini. Ada sembilan plot pencar, satu untuk setiap kategori variabel umur saya.
EDIT 2:
. estat recovariance
Random-effects covariance matrix for level cohort21
| bw1 _cons
-------------+----------------------
bw1 | .0049087
_cons | -.0119882 .0480407
Ada hal lain yang ingin saya tambahkan: Apa yang mengganggu saya adalah, berkenaan dengan kovarians / korelasi intersep-slope, Joop J. Hox (2010, hal. 90) dalam bukunya "Teknik dan Aplikasi Analisis Bertingkat, Edisi Kedua" mengatakan bahwa:
Lebih mudah untuk menafsirkan kovarians ini jika disajikan sebagai korelasi antara intersep dan residu lereng. ... Dalam model tanpa prediktor lain kecuali variabel waktu, korelasi ini dapat diartikan sebagai korelasi biasa, tetapi dalam model 5 dan 6 itu adalah korelasi parsial, tergantung pada prediktor dalam model.
Jadi, tampaknya tidak semua orang akan setuju dengan Snijders & Bosker (1999, hal. 119) yang percaya bahwa "gagasan korelasi tidak masuk akal di sini" karena tidak dibatasi antara [-1, 1].