Oke, mari kita lihat situasi Anda. Pada dasarnya Anda memiliki dua regresi (APD = diameter antero-posterior, NOL = panjang naso-oksipital, HL = panjang humerus):
- A PD = β0 , 1+ β1 , 1⋅ NO L
- HL = β0 , 2+ β1 , 2⋅ NO L
Untuk menguji hipotesis , Anda dapat melakukan hal berikut:β1 , 1= β1 , 2
- Buat variabel dependen baru ( ) hanya dengan menambahkan APD ke HLYn e w
- Buat variabel independen baru dengan menambahkan NOL ke dirinya sendiri ( ) (yaitu menduplikasi NOL)Xn e w
- Buat variabel dummy ( ) yaitu 1 jika data berasal dari dataset kedua (dengan HL) dan 0 jika data berasal dari dataset pertama (APD).D
- Hitung regresi dengan sebagai variabel dependen, dan efek utama serta interaksi antara dan variabel dummy sebagai variabel penjelas. EDIT @Jake Westfall menunjukkan bahwa kesalahan standar residual dapat berbeda untuk dua regresi untuk setiap DV. Jake memberikan jawaban yang sesuai dengan model kuadrat terkecil umum (GLS) yang memungkinkan kesalahan standar residual berbeda antara dua regresi. X n e w DYn e wXn e wD
Mari kita lihat contoh dengan data buatan (dalam R
):
# Create artificial data
library(nlme) # needed for the generalized least squares
set.seed(1500)
NOL <- rnorm(10000,100,12)
APD <- 10 + 15*NOL+ rnorm(10000,0,2)
HL <- - 2 - 5*NOL+ rnorm(10000,0,3)
mod1 <- lm(APD~NOL)
mod1
Coefficients:
(Intercept) NOL
10.11 15.00
mod2 <- lm(HL~NOL)
mod2
Coefficients:
(Intercept) NOL
-1.96 -5.00
# Combine the dependent variables and duplicate the independent variable
y.new <- c(APD, HL)
x.new <- c(NOL, NOL)
# Create a dummy variable that is 0 if the data are from the first data set (APD) and 1 if they are from the second dataset (HL)
dummy.var <- c(rep(0, length(APD)), rep(1, length(HL)))
# Generalized least squares model allowing for differend residual SDs for each regression (strata of dummy.var)
gls.mod3 <- gls(y.new~x.new*dummy.var, weights=varIdent(form=~1|dummy.var))
Variance function:
Structure: Different standard deviations per stratum
Formula: ~1 | dummy.var
Parameter estimates:
0 1
1.000000 1.481274
Coefficients:
Value Std.Error t-value p-value
(Intercept) 10.10886 0.17049120 59.293 0
x.new 14.99877 0.00169164 8866.430 0
dummy.var -12.06858 0.30470618 -39.607 0
x.new:dummy.var -19.99917 0.00302333 -6614.939 0
Catatan: Intersep dan kemiringan untuk persis sama seperti pada regresi pertama (mod1). Koefisien menunjukkan perbedaan antara intersepsi dari dua regresi. Selanjutnya: standar deviasi residual dari regresi kedua diperkirakan lebih besar dari SD yang pertama (sekitar 1,5 kali lebih besar). Ini adalah persis apa yang kami tentukan dalam pembuatan data (2 vs. 3). Kita hampir sampai: Koefisien dari istilah interaksi ( ) menguji kesetaraan lereng. Di sini kemiringan regresi kedua (mod2) adalah tentang atau sekitar . Perbedaan β x . n e w - β x . n e w × d u m m y . v a r 15 - 20 = - 5 20Xn e wdummy.var
x.new:dummy.var
βx . n e w- βx . n e w × du m m y. v a r15 - 20 = - 520persis seperti yang kami tentukan saat kami menghasilkan data. Jika Anda bekerja di Stata, ada penjelasan yang bagus di sini.
Peringatan: Ini hanya berfungsi jika diameter antero-posterior dan panjang naso-oksipital (dua variabel dependen) independen. Kalau tidak, itu bisa sangat rumit.
EDIT
Dua posting di situs ini menangani pertanyaan yang sama: Pertama dan kedua .