Mengapa produk dari koefisien regresi bivariat dari garis on- dan on- sama dengan kuadrat korelasi?


11

Ada model regresi di mana dengan dan b = 0,4 , yang memiliki koefisien korelasi r = 0,60302 .a = 1,6 b = 0,4 r = 0,60302Y=a+bXa=1.6b=0.4r=0.60302

Jika dan kemudian beralih dan persamaan menjadi mana dan , ia juga memiliki nilai .Y X = c + d Y c = 0.4545 d = 0.9091 r 0.60302XYX=c+dYc=0.4545d=0.9091r0.60302

Saya berharap seseorang dapat menjelaskan mengapa juga . 0,60302(d×b)0.50.60302

Jawaban:



10

Lihatlah Tiga Belas Cara untuk Melihat Koefisien Korelasi - dan terutama cara 3, 4, 5 akan sangat menarik bagi Anda.


2
Ini mungkin seharusnya komentar. Perhatikan bahwa tautannya mati. Saya telah memperbarui tautan & memberikan kutipan lengkap. Bisakah Anda menguraikan, atau memberikan informasi tambahan sehingga ini akan tetap bernilai bahkan jika tautannya mati lagi?
gung - Reinstate Monica

2
Artikel Rodgers & Nicewander dirangkum di situs kami di stats.stackexchange.com/q/70969/22228 .
whuber

3

Ingat bahwa banyak teks pengantar mendefinisikan

Sxy=i=1n(xix¯)(yiy¯)

Kemudian dengan menetapkan sebagai kita memiliki dan demikian pula .x S x x = n i = 1 ( x i - ˉ x ) 2 S y y = n i = 1 ( y i - ˉ y ) 2yxSxx=i=1n(xix¯)2Syy=i=1n(yiy¯)2

Rumus untuk koefisien korelasi , kemiringan dari regresi on- ( Anda ) dan kemiringan dari regresi on- (Anda ) sering diberikan sebagai:y x b x y dryxbxyd

(1)r=SxySxxSyy(2)β^y on x=SxySxx(3)β^x on y=SxySyy

Kemudian mengalikan dan dengan jelas memberikan kuadrat dari :(2)(3)(1)

β^y on xβ^x on y=Sxy2SxxSyy=r2

Atau pembilang dan penyebut dari fraksi dalam , dan sering dibagi dengan atau sehingga hal-hal dibingkai dalam hal sampel atau perkiraan varians dan kovariansi. Misalnya, dari , koefisien korelasi yang diestimasi hanyalah estimasi kovarians, yang diukur dengan estimasi standar deviasi:(1)(2)(3)n(n1)(1)

(4)r=Corr^(X,Y)=Cov^(X,Y)SD(X)^SD(Y)^(5)β^y on x=Cov^(X,Y)Var(X)^(6)β^x on y=Cov^(X,Y)Var(Y)^

Kami kemudian segera menemukan dari mengalikan dan itu(5)(6)

β^y on xβ^x on y=Cov^(X,Y)2Var(X)^Var(Y)^=(Cov^(X,Y)SD(X)^SD(Y)^)2=r2

Kami mungkin sebaliknya telah mengatur ulang untuk menulis kovarians sebagai korelasi "ditingkatkan":(4)

(7)Cov^(X,Y)=rSD(X)^SD(Y)^

Kemudian dengan mengganti menjadi dan kita dapat menulis ulang koefisien regresi sebagai dan . Mengalikan ini bersama-sama juga akan menghasilkan , dan ini adalah solusi @ Karl. Menuliskan lereng dengan cara ini membantu menjelaskan bagaimana kita dapat melihat koefisien korelasi sebagai kemiringan regresi standar .(7)(5)(6)β^y on x=rSD^(y)SD^(x)β^x on y=rSD^(x)SD^(y)r2


Terakhir perhatikan bahwa dalam kasus Anda tetapi ini karena korelasi Anda positif. Jika korelasi Anda negatif, maka Anda harus mengambil akar negatif.r=bd=β^y on xβ^x on y

Untuk mengetahui apakah korelasi Anda positif atau negatif, Anda hanya perlu memperhatikan tanda (plus atau minus) dari koefisien regresi Anda - tidak masalah apakah Anda melihat -on-0 atau -on karena tanda-tanda mereka akan sama. Jadi Anda bisa menggunakan rumus: x x yyxxy

r=sgn(β^y on x)β^y on xβ^x on y

di mana adalah fungsi signum , yaitu jika kemiringan positif dan jika kemiringan negatif.+ 1 - 1sgn+11


1
Anda mungkin menemukan jawaban saya ini menarik meskipun tidak secara eksplisit menjawab pertanyaan yang diajukan di sini.
Dilip Sarwate
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.