Kovarian dua variabel telah dihitung menjadi -150. apa yang dikatakan statistik tentang hubungan antara dua variabel?
Kovarian dua variabel telah dihitung menjadi -150. apa yang dikatakan statistik tentang hubungan antara dua variabel?
Jawaban:
Untuk menambah jawaban Łukasz Deryło : saat ia menulis, kovarians -150 menyiratkan hubungan negatif. Apakah ini hubungan yang kuat atau yang lemah tergantung pada varian variabel. Di bawah ini saya memplot contoh untuk hubungan yang kuat (masing-masing variabel terpisah memiliki varians 200, sehingga kovarians besar, secara absolut, dibandingkan dengan varians), dan untuk hubungan yang lemah (masing-masing varians adalah 2000, sehingga kovarians kecil , secara absolut, dibandingkan dengan varians).
variance <- 200
:variance <- 2000
:library(MASS)
nn <- 100
epsilon <- 0.1
variance <- 2000 # weak relationship
opar <- par(mfrow=c(2,2))
for ( ii in 1:4 ) {
while ( TRUE ) {
dataset <- mvrnorm(n=100,mu=c(0,0),Sigma=rbind(c(2000,-150),c(-150,2000)))
if ( abs(cov(dataset)[1,2]-(-150)) < epsilon ) break
}
plot(dataset,pch=19,xlab="",ylab="",main=paste("Covariance:",cov(dataset)[1,2]))
}
par(opar)
Sebagai catatan whuber, kovarian itu sendiri tidak benar-benar memberi tahu kita banyak tentang dataset. Sebagai ilustrasi, saya akan mengambil kuartet Anscombe dan memodifikasinya sedikit. Perhatikan bagaimana scatterplots yang sangat berbeda dapat memiliki kovarians (bulat) yang sama dengan -150:
anscombe.mod <- anscombe
anscombe.mod[,c("x1","x2","x3","x4")] <- sqrt(150/5.5)*anscombe[,c("x1","x2","x3","x4")]
anscombe.mod[,c("y1","y2","y3","y4")] <- -sqrt(150/5.5)*anscombe[,c("y1","y2","y3","y4")]
opar <- par(mfrow=c(2,2))
with(anscombe.mod,plot(x1,y1,pch=19,main=paste("Covariance:",round(cov(x1,y1),0))))
with(anscombe.mod,plot(x2,y2,pch=19,main=paste("Covariance:",round(cov(x2,y2),0))))
with(anscombe.mod,plot(x3,y3,pch=19,main=paste("Covariance:",round(cov(x3,y3),0))))
with(anscombe.mod,plot(x4,y4,pch=19,main=paste("Covariance:",round(cov(x4,y4),0))))
par(opar)
Akhirnya, inilah kovarians -150 dengan "hubungan negatif" yang paling lemah di antara keduanya dan yg ada:
xx <- yy <- seq(0,100,by=10)
yy[9] <- -336.7
plot(xx,yy,pch=19,main=paste("Covariance:",cov(xx,yy)))
Ini hanya memberi tahu Anda bahwa hubungan itu negatif. Ini berarti bahwa nilai rendah dari satu variabel cenderung terjadi bersama dengan nilai tinggi lainnya.
Sulit untuk mengatakan apakah kovarians ini besar atau kecil (jika hubungan Anda kuat atau lemah) karena rentang dari untuk . Jadi itu tergantung pada skala variabel Anda.
Untuk menilai apakah hubungan ini kuat atau tidak, Anda perlu mengubah kovarians menjadi korelasi (bagi dengan ). Ini berkisar dari untuk dan banyak pedoman interpretasi yang berbeda dapat ditemukan di Web dan buku teks.
Anda dapat menjalankan uji signifikansi korelasi juga.