Ada berbagai kemungkinan yang dijelaskan oleh JW Gillard dalam An Historis Tinjauan Regresi Linier dengan Kesalahan di kedua Variabel
Jika Anda tidak tertarik dalam rincian atau alasan untuk memilih salah satu metode di atas yang lain, hanya pergi dengan sederhana, yaitu untuk menarik garis melalui pusat massa dengan kemiringan β = s y / s x , yaitu rasio deviasi standar yang diamati (membuat tanda kemiringan sama dengan tanda kovarians x dan y ); karena Anda mungkin dapat bekerja keluar, ini memberikan intercept pada y sumbu dari α = ˉ y - ß ˉ x .(x¯,y¯)β^=sy/sxxyyα^=y¯−β^x¯.
Kelebihan dari pendekatan khusus ini adalah
- itu memberikan garis yang sama membandingkan terhadap y seperti y terhadap x ,xyyx
- itu skala-invarian sehingga Anda tidak perlu khawatir tentang unit,
- itu terletak di antara dua garis regresi linier biasa
- itu melintasi mereka di mana mereka saling bersilangan di pusat pengamatan, dan
- sangat mudah untuk dihitung.
Kemiringan adalah rata-rata geometrik dari lereng dari dua kemiringan regresi linier biasa. Ini juga yang akan Anda dapatkan jika Anda menstandarisasi pengamatan dan y , menggambar garis pada 45 ° (atau 135 ° jika ada korelasi negatif) dan kemudian mende-standarisasi garis. Dapat juga dilihat sebagai ekuivalen dengan membuat asumsi implisit bahwa varians dari dua set kesalahan sebanding dengan varians dari dua set pengamatan; sejauh yang saya tahu, Anda mengaku tidak tahu jalan mana yang salah.xy
Berikut adalah beberapa kode R untuk diilustrasikan: garis merah dalam grafik adalah regresi OLS pada X , garis biru adalah regresi OLS X pada Y , dan garis hijau adalah metode sederhana ini. Perhatikan bahwa kemiringannya harus sekitar 5.YXXY
X0 <- 1600:3600
Y0 <- 5*X0 + 700
X1 <- X0 + 400*rnorm(2001)
Y1 <- Y0 + 2000*rnorm(2001)
slopeOLSXY <- lm(Y1 ~ X1)$coefficients[2] #OLS slope of Y on X
slopeOLSYX <- 1/lm(X1 ~ Y1)$coefficients[2] #Inverse of OLS slope of X on Y
slopesimple <- sd(Y1)/sd(X1) *sign(cov(X1,Y1)) #Simple slope
c(slopeOLSXY, slopeOLSYX, slopesimple) #Show the three slopes
plot(Y1~X1)
abline(mean(Y1) - slopeOLSXY * mean(X1), slopeOLSXY, col="red")
abline(mean(Y1) - slopeOLSYX * mean(X1), slopeOLSYX, col="blue")
abline(mean(Y1) - slopesimple * mean(X1), slopesimple, col="green")