Varians produk dari variabel dependen


32

Apa rumus untuk varian produk dari variabel dependen?

Dalam kasus variabel independen, rumusnya sederhana:

var(XY)=E(X2Y2)E(XY)2=var(X)var(Y)+var(X)E(Y)2+var(Y)E(X)2
Tapi apa rumus untuk variabel berkorelasi?

Omong-omong, bagaimana saya bisa menemukan korelasi berdasarkan data statistik?

Jawaban:


32

Nah, menggunakan identitas yang sudah Anda kenal,

var(XY)=E(X2Y2)E(XY)2

Menggunakan rumus analog untuk kovarians,

E(X2Y2)=cov(X2,Y2)+E(X2)E(Y2)

dan

E(XY)2=[cov(X,Y)+E(X)E(Y)]2

yang menyiratkan bahwa, secara umum, dapat ditulis sebagaivar(XY)

cov(X2,Y2)+[var(X)+E(X)2][var(Y)+E(Y)2][cov(X,Y)+E(X)E(Y)]2

Perhatikan bahwa dalam kasus independensi, cov(X2,Y2)=cov(X,Y)=0 dan ini berkurang menjadi

[var(X)+E(X)2][var(Y)+E(Y)2][E(X)E(Y)]2

dan dua istilah [E(X)E(Y)]2 dibatalkan dan Anda dapatkan

var(X)var(Y)+var(X)E(Y)2+var(Y)E(X)2

seperti yang Anda tunjukkan di atas.

Sunting: Jika semua yang Anda amati adalah dan bukan dan secara terpisah, maka saya tidak berpikir ada cara bagi Anda untuk memperkirakan atau kecuali dalam kasus khusus (misalnya, jika memiliki cara yang dikenal sebagai apriori )X Y c o v ( X , Y ) c o v ( X 2 , Y 2 ) X , YXYXYcov(X,Y)cov(X2,Y2)X,Y


2
mengapa Anda meletakkan [var (X) + E (X) 2] ⋅ [var (Y) + E (Y) 2] bukannya E (X2) E (Y2) ???

1
@ user35458, sehingga ia dapat berakhir dengan persamaan sebagai ekspresi var (X) dan var (Y), sehingga dapat dibandingkan dengan pernyataan OP. Perhatikan bahwa E (X ^ 2) = Var (X) + E (X) ^ 2.
Waldir Leoncio

2
Untuk menanggapi (offline) tantangan yang sekarang dihapus pada validitas jawaban ini, saya membandingkan hasilnya dengan perhitungan langsung varian produk dalam banyak simulasi. Ini bukan formula praktis untuk digunakan jika Anda bisa menghindarinya, karena bisa kehilangan ketepatan substansial melalui pembatalan dalam mengurangi satu istilah besar dari yang lain - tetapi bukan itu intinya. Satu perangkap untuk diwaspadai adalah bahwa pertanyaan ini menyangkut variabel acak. Hasilnya berlaku untuk data asalkan Anda menghitung varian dan kovarian menggunakan penyebut daripadan - 1nn1 (seperti biasa untuk perangkat lunak).
whuber

14

Ini merupakan tambahan untuk jawaban yang sangat bagus dari @ Macro yang menjabarkan apa yang perlu diketahui untuk menentukan varian produk dari dua variabel acak berkorelasi. Karena mana , , , , dan cov(X,Y)E[X]E[Y]E[X2]E [Y2]E[X2Y2](2)cov(X2,Y2)(3)XYcov(X

(1)var(XY)=E[(XY)2]-(E[XY])2=E[(XY)2]-(cov(X,Y)+E[X]E[Y])2(2)=E[X2Y2]-(cov(X,Y)+E[X]E[Y])2(3)=(cov(X2,Y2)+E[X2]E[Y2])-(cov(X,Y)+E[X]E[Y])2
cov(X,Y)E[X]E[Y]E[X2]E[Y2] dapat dianggap jumlah yang diketahui, kita harus dapat menentukan nilai di atau di . Ini tidak mudah dilakukan secara umum, tetapi, sebagaimana telah ditunjukkan sebelumnya, jika dan adalah variabel acak independen , maka . Sebenarnya, ketergantungan, bukan korelasi (atau ketiadaan) adalah masalah utama. Kita tahu bahwa sama dengan bukannya beberapa nilai bukan nol, dengan sendirinya,E[X2Y2](2)cov(X2,Y2)(3)XYcov ( X , Y ) 0 E [ X 2 Y 2 ] cov (cov(X,Y)=cov(X2,Y2)=0cov(X,Y)0bantuan dalam upaya kami adalah menentukan nilai atau meskipun tidak menyederhanakan sisi kanan dan sedikit.E[X2Y2]( 2 ) ( 3 )cov(X2,Y2)(2)(3)

Ketika dan adalah variabel acak dependen , maka dalam setidaknya satu kasus khusus (cukup umum atau cukup penting), adalah mungkin untuk menemukan nilai relatif mudah.Y E [ X 2 Y 2 ]XYE[X2Y2]

Misalkan dan adalah variabel acak bersama - sama normal dengan koefisien korelasi . Kemudian, dikondisikan pada , kepadatan bersyarat dari adalah kepadatan normal dengan rata-rata dan varians . Jadi, Y ρ X = x Y E [ Y ] + ρ XYρX=xYvar(Y)(1-ρ2)E[X2Y2X]E[Y]+ρvar(Y)var(X)(x-E[X])var(Y)(1-ρ2)Xg(X)E[X2Y2

E[X2Y2X]=X2E[Y2X]=X2[var(Y)(1-ρ2)+(E[Y]+ρvar(Y)var(X)(X-E[X]))2]
yang merupakan fungsi kuartik dari , katakanlah , dan Hukum Harapan Berulang memberitahu kita bahwa mana sisi kanan dapat dihitung dari pengetahuan tentang momen 3 dan 4 hasil standar yang dapat ditemukan dalam banyak teks dan buku referensi (artinya bahwa saya terlalu malas untuk mencari mereka dan memasukkannya dalam jawaban ini).Xg(X) (4)X
(4)E[X2Y2]=E[E[X2Y2X]]=E[g(X)]
(4)X

Tambahan tambahan: Dalam jawaban yang sekarang dihapus, @Hydrologist memberikan varian sebagai dan mengklaim bahwa rumus ini berasal dari dua makalah yang diterbitkan setengah abad yang lalu di JASA. Rumus ini adalah transkripsi yang salah dari hasil dalam makalah yang dikutip oleh Hydrologist. Secara khusus,V a r [ x y ] = ( E [ x ] ) 2 V a r [ y ] + ( E [ y ] )XY

(5)VSebuahr[xy]=(E[x])2VSebuahr[y]+(E[y])2VSebuahr[x]+2E[x]CHaiv[x,y2]+2E[y]CHaiv[x2,y]+2E[x]E[y]CHaiv[x,y]+CHaiv[x2,y2]-(CHaiv[x,y])2
CHaiv[x2,y2]adalah salah penerjemahan dalam artikel jurnal, dan juga untuk dan .C o v [ x 2 , y ] C o v [ x , y 2 ]E[(x-E[x])2(y-E[y])2]CHaiv[x2,y]CHaiv[x,y2]

Untuk perhitungan dalam kasus normal bersama, juga lihat math.stackexchange.com/questions/668641/…E(X2Y2)
Samuel Reid
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.