Regresi standar meminimalkan jarak vertikal antara titik-titik dan garis, sehingga beralih 2 variabel sekarang akan meminimalkan jarak horizontal (diberi sebar sebaran yang sama). Pilihan lain (yang menggunakan beberapa nama) adalah untuk meminimalkan jarak tegak lurus, ini dapat dilakukan dengan menggunakan komponen utama.
Berikut ini beberapa kode R yang menunjukkan perbedaan:
library(MASS)
tmp <- mvrnorm(100, c(0,0), rbind( c(1,.9),c(.9,1)) )
plot(tmp, asp=1)
fit1 <- lm(tmp[,1] ~ tmp[,2]) # horizontal residuals
segments( tmp[,1], tmp[,2], fitted(fit1),tmp[,2], col='blue' )
o <- order(tmp[,2])
lines( fitted(fit1)[o], tmp[o,2], col='blue' )
fit2 <- lm(tmp[,2] ~ tmp[,1]) # vertical residuals
segments( tmp[,1], tmp[,2], tmp[,1], fitted(fit2), col='green' )
o <- order(tmp[,1])
lines( tmp[o,1], fitted(fit2)[o], col='green' )
fit3 <- prcomp(tmp)
b <- -fit3$rotation[1,2]/fit3$rotation[2,2]
a <- fit3$center[2] - b*fit3$center[1]
abline(a,b, col='red')
segments(tmp[,1], tmp[,2], tmp[,1]-fit3$x[,2]*fit3$rotation[1,2], tmp[,2]-fit3$x[,2]*fit3$rotation[2,2], col='red')
legend('bottomright', legend=c('Horizontal','Vertical','Perpendicular'), lty=1, col=c('blue','green','red'))
Untuk mencari pencilan Anda cukup memplot hasil analisis komponen utama.
Anda mungkin juga ingin melihat:
Bland dan Altman (1986), Metode Statistik untuk Menilai Perjanjian Antara Dua Metode Pengukuran Klinis. Lancet, hlm 307-310