Baik korelasi dan kovarian mengukur hubungan linier antara dua variabel yang diberikan dan tidak berkewajiban untuk mendeteksi bentuk asosiasi lain apa pun.
Jadi kedua variabel tersebut dapat dikaitkan dengan beberapa cara non-linear dan kovarian (dan, oleh karena itu, korelasi) tidak dapat dibedakan dari kasus independen.
Sebagai sangat didaktik, buatan dan contoh non realistis, seseorang dapat mempertimbangkan X sehingga P(X=x)=1/3 untuk x=−1,0,1 dan juga mempertimbangkan Y=X2 . Perhatikan bahwa mereka tidak hanya terkait, tetapi satu adalah fungsi dari yang lain. Meskipun demikian, kovarians mereka adalah 0, karena hubungan mereka ortogonal dengan asosiasi yang dapat dideteksi oleh kovarians.
EDIT
Memang, seperti yang ditunjukkan oleh @whuber, jawaban asli di atas sebenarnya adalah komentar tentang bagaimana pernyataan itu tidak benar secara universal jika kedua variabel tidak harus dikotomis. Salahku!
Jadi mari kita berhitung. (Setara dengan Barney Stinson's "Suit up!")
Kasus tertentu
Jika X dan Y keduanya dikotomis, maka Anda dapat mengasumsikan, tanpa kehilangan keumuman, bahwa keduanya hanya mengasumsikan nilai 0 dan 1 dengan probabilitas arbitrer p , q dan r diberikan oleh
P(X=1)=p∈[0,1]P(Y=1)=q∈[0,1]P(X=1,Y=1)=r∈[0,1],
yang mencirikan sepenuhnya distribusi gabungan dari
Xdan
Y. Mengambil petunjuk @ DilipSarwate, perhatikan bahwa ketiga nilai tersebut cukup untuk menentukan distribusi gabungan
(X,Y), karena
(Di samping catatan, tentu saja
rterikat untuk menghormati
p-r∈[0,1],
q-r∈[0,1]dan
1-p-q-r∈[P(X=0,Y=1)P(X=1,Y=0)P(X=0,Y=0)=P(Y=1)−P(X=1,Y=1)=q−r=P(X=1)−P(X=1,Y=1)=p−r=1−P(X=0,Y=1)−P(X=1,Y=0)−P(X=1,Y=1)=1−(q−r)−(p−r)−r=1−p−q−r.
rp−r∈[0,1]q−r∈[0,1] luar
r ∈ [ 0 , 1 ] , yaitu
r ∈ [ 0 , min ( p , q , 1 - p - q ) ] .)
1−p−q−r∈[0,1]r∈[0,1]r∈[0,min(p,q,1−p−q)]
Perhatikan bahwa mungkin sama dengan produk p ⋅ q = P ( X = 1 ) P ( Y = 1 ) , yang akan membuat X dan Y independen, karena
P ( X = 0 , Y = 0 )r=P(X=1,Y=1)p⋅q=P(X=1)P(Y=1)XY
P(X=0,Y=0)P(X=1,Y=0)P(X=0,Y=1)=1−p−q−pq=(1−p)(1−q)=P(X=0)P(Y=0)=p−pq=p(1−q)=P(X=1)P(Y=0)=q−pq=(1−p)q=P(X=0)P(Y=1).
Ya, mungkin sama dengan p q , TAPI itu bisa berbeda, asalkan itu menghormati batas-batas di atas.rpq
Nah, dari distribusi bersama di atas, kita akan memiliki
E(X)E(Y)E(XY)Cov(X,Y)=0⋅P(X=0)+1⋅P(X=1)=P(X=1)=p=0⋅P(Y=0)+1⋅P(Y=1)=P(Y=1)=q=0⋅P(XY=0)+1⋅P(XY=1)=P(XY=1)=P(X=1,Y=1)=r=E(XY)−E(X)E(Y)=r−pq
Now, notice then that X and Y are independent if and only if Cov(X,Y)=0. Indeed, if X and Y are independent, then P(X=1,Y=1)=P(X=1)P(Y=1), which is to say r=pq. Therefore, Cov(X,Y)=r−pq=0; and, on the other hand, if Cov(X,Y)=0, then r−pq=0, which is to say r=pq. Therefore, X and Y are independent.
General Case
About the without loss of generality clause above, if X and Y were distributed otherwise, let's say, for a<b and c<d,
P(X=b)=pP(Y=d)=qP(X=b,Y=d)=r
then
X′ and
Y′ given by
X′=X−ab−aandY′=Y−cd−c
would be distributed just as characterized above, since
X=a⇔X′=0,X=b⇔X′=1,Y=c⇔Y′=0andY=d⇔Y′=1.
So
X and
Y are independent
if and only if X′ and
Y′ are independent.
Also, we would have
E(X′)E(Y′)E(X′Y′)Cov(X′,Y′)=E(X−ab−a)=E(X)−ab−a=E(Y−cd−c)=E(Y)−cd−c=E(X−ab−aY−cd−c)=E[(X−a)(Y−c)](b−a)(d−c)=E(XY−Xc−aY+ac)(b−a)(d−c)=E(XY)−cE(X)−aE(Y)+ac(b−a)(d−c)=E(X′Y′)−E(X′)E(Y′)=E(XY)−cE(X)−aE(Y)+ac(b−a)(d−c)−E(X)−ab−aE(Y)−cd−c=[E(XY)−cE(X)−aE(Y)+ac]−[E(X)−a][E(Y)−c](b−a)(d−c)=[E(XY)−cE(X)−aE(Y)+ac]−[E(X)E(Y)−cE(X)−aE(Y)+ac](b−a)(d−c)=E(XY)−E(X)E(Y)(b−a)(d−c)=1(b−a)(d−c)Cov(X,Y).
So
Cov(X,Y)=0 if and only Cov(X′,Y′)=0.
=D