Pertama, saya akan memperkenalkan model keempat untuk diskusi dalam jawaban saya:
fit1.5 <- lm (y_2 ~ x_1 + x_2 + y_1)
Bagian 0
Perbedaan antara fit1 dan fit1.5 diringkas sebagai perbedaan antara perbedaan dibatasi vs perbedaan optimal.
Saya akan menggunakan contoh yang lebih sederhana untuk menjelaskan ini daripada yang disediakan di atas. Mari kita mulai dengan fit1.5. Versi model yang lebih adalah
Tentu saja, ketika kita mendapatkan estimasi OLS, itu akan menemukan pilihan "optimal" untuk . Dan, meskipun rasanya aneh menulis seperti itu, kita dapat menulis ulang rumus sebagai
Kita dapat menganggap ini sebagai perbedaan "optimal" antara kedua variabel .
y2=b0+b1⋅x+b2⋅y1
b2y2−b2⋅y1=b0+b1⋅x
y
Sekarang, jika kita memutuskan untuk membatasi , maka rumus / model menjadi
yang merupakan perbedaan (terbatas).b2=1
y2−y1=b0+b1⋅x
Catatan, dalam demonstrasi di atas, jika Anda membiarkan menjadi variabel dikotomis, dan menjadi pre-test dan skor tes pasangan pos, maka model perbedaan dibatasi hanya akan menjadi sampel independen -test untuk keuntungan dalam skor , sedangkan model perbedaan optimal adalah tes ANCOVA dengan skor pre-test digunakan sebagai kovariat.xy1y2t
Bagian 1
Model untuk fit2 dapat dipikirkan dengan cara yang mirip dengan pendekatan perbedaan yang digunakan di atas. Meskipun ini merupakan penyederhanaan yang berlebihan (seperti saya sengaja meninggalkan keluar istilah error), model bisa disajikan sebagai
di mana untuk nilai-nilai dan untuk nilai-nilai . Inilah penyederhanaan yang berlebihan ... mari kita tulis ini
Ditulis dengan cara lain, . Sedangkan model fit1.5 memiliki sebagai nilai untuk membuat perbedaan optimal untuk analisis OLS, di sinit = 0 y 1 t = 1 y 2 y 1
y=b0+b1⋅x+b2⋅t
t=0y1t=1y2 y2-y1=b2b2b2yy1y2=b0+b1⋅x=b0+b1⋅x+b2
y2−y1=b2b2b2pada dasarnya hanya perbedaan rata-rata antara nilai-nilai (setelah mengendalikan kovariat lainnya).
y
Bagian 2
Jadi apa perbedaan antara model fit2 dan fit3 ... sebenarnya, sangat sedikit. Model fit3 memang memperhitungkan korelasi dalam hal kesalahan, tetapi ini hanya mengubah proses estimasi, dan dengan demikian perbedaan antara dua output model akan minimal (di luar fakta bahwa fit3 memperkirakan faktor autoregresif).
Bagian 2.5
Dan saya akan memasukkan satu lagi model dalam diskusi ini
fit4 <- lmer (y ~ waktu + x1 + x2 + (1 | id), data = df.long)
Model efek-campuran ini melakukan versi yang sedikit berbeda dari pendekatan autoregresif. Jika kita memasukkan koefisien waktu dalam efek acak, ini akan sebanding dengan menghitung perbedaan antara untuk setiap subjek. (Tapi, ini tidak akan berhasil ... dan modelnya tidak akan berjalan.)y
Holland, Paul & Donald Rubin. 1983. On Lord’s Paradox. In Principles of modern psychological measurement: A festchrift for Frederic M. Lord edited by Wainer, Howard & Samuel Messick pgs:3-25. Lawrence Erlbaum Associates. Hillsdale, NJ.