Korelasi antara X dan XY


11

Jika saya memiliki dua variabel acak independen X dan Y, apa korelasi antara X dan produk XY? Jika ini tidak diketahui, saya akan tertarik untuk mengetahui setidaknya apa yang terjadi dalam kasus spesifik X dan Y yang normal dengan nol rata-rata, jika itu lebih mudah untuk diselesaikan.


4
Apa yang memotivasi pertanyaan ini? Saya bertanya-tanya apakah akan lebih baik jika kita juga membahas hal lain di sini. Apakah Anda melakukan studi di mana Anda telah membuat variabel XY karena beberapa alasan?
gung - Reinstate Monica

Jawaban:


13

Larutan

Saya bawa bahwa solusi yang valid akan menjadi salah satu yang mengekspresikan - jika mungkin - korelasi dalam hal sifat-sifat yang terpisah dari variabel dan . Komputasi korelasi akan melibatkan menghitung covariances dari monomials di dan . Sangat ekonomis untuk menyelesaikan ini sekaligus. Cukup amati ituY X YXYXY

  1. Ketika dan adalah independen dan dan adalah kekuatan, maka dan adalah independen;Y i j X i Y jXYijXiYj

  2. Ekspektasi produk dari variabel independen adalah produk dari harapan mereka.

Hal ini akan memberikan rumus dalam hal saat-saat dan .YXY

Hanya itu yang ada untuk itu.


Detail

Tuliskan , dll. Untuk saat ini. Jadi, untuk bilangan apa pun yang perhitungannya masuk akal dan menghasilkan angka yang terbatas,i , j , k , lμi(X)=E(Xi)i,j,k,l

Cov(XiYj,XkYl)=E(XiYjXkYl)E(XiYj)E(XkYl)=μi+k(X)μj+l(Y)μi(X)μk(X)μj(Y)μl(Y).

Perhatikan bahwa varians dari setiap variabel acak adalah kovariansnya sendiri, jadi kami tidak perlu melakukan perhitungan khusus untuk varian.

Sekarang harus jelas bagaimana menghitung momen yang melibatkan monomial, dari kekuatan apa pun, dari sejumlah variabel acak independen. Sebagai aplikasi, terapkan hasil ini pada definisi korelasi, yang merupakan kovarians dibagi dengan akar kuadrat dari varians:

Cor(X,XY)=Cov(X1Y0,X1Y1)Cov(X1Y0,X1Y0) Cov(X1Y1,X1Y1)=μ2(X)μ1(Y)μ1(X)2μ1(Y)(μ2(X)μ1(X)2)(μ2(X)μ2(Y)μ1(X)2μ2(Y)2).

Ada berbagai penyederhanaan aljabar yang dapat Anda pilih jika Anda ingin menghubungkan ini dengan harapan, varian, dan kovarian dari variabel asli, tetapi menjalankannya di sini tidak akan memberikan wawasan lebih lanjut.


14

Dengan menggunakan hukum kovarian total dan independensi dan , Menggunakan hukum varians total, dan sekali lagi, independensi, Perhatikan bagaimanaY Cov ( X , X Y )XY

Cov(X,XY)=ECov(X,XY|Y)+Cov(EX|Y,EXY|Y)=E(YCov(X,X))+Cov(EX,YEX)=E(YVarX)+Cov(EX,YEX)=EYVarX.
Var(XY)=EVar(XY|Y)+VarE(XY|Y)=E(Y2(VarX|Y))+Var(Y(EX|Y))=E(Y2VarX)+Var(YEX)=E(Y2)VarX+(EX)2VarY=VarXVarY+(EY)2VarX+(EX)2VarY.
Y dapat diperlakukan sebagai konstanta dalam salah satu dari harapan, varian, atau kovariansi kondisional dalam di atas.

Dari kovarians dan varian di atas, korelasi dapat, setelah beberapa manipulasi aljabar, diekspresikan dengan baik dalam dua koefisien variasi sebagai

corr(X,XY)=11+VarY(EY)2(1+(EX)2VarX).

Pemeriksaan hasil ini dengan simulasi:

> n <- 1e+6
> x <- rexp(n,2)-2
> y <- rnorm(n,mean=5)
> cv2 <- function(x) var(x)/mean(x)^2
> 1/sqrt(1+cv2(y)*(1+1/cv2(x)))
[1] 0.844882
> cor(x,x*y)
[1] 0.8445373

Bagus, tapi saya ingin menunjukkan beberapa hal: 1. Pada baris ketiga dari persamaan kedua, harus ada tanda kurung seperti dalam ? 2. Apakah Anda yakin bahwa orang yang mengajukan pertanyaan mengikuti alasan di balik langkah-langkah yang berbeda? Mis. demikian karena diberikan. Saya akan menyarankan penjelasan minimal untuk beberapa langkah. E(Y2VarX)+Var(YEX)ECov(X,XY|Y)=EYCov(X,X)Y
Antoni Parellada

1
Ya, saya menambahkan beberapa tanda kurung yang hilang dan beberapa penjelasan. Saya harus mengakui bahwa saya lebih suka jawaban @whuber.
Jarle Tufto

5

Dalam kasus spesifik X dan Y menjadi variabel acak dengan nol berarti, maka karena . KarenanyaE ( X 2 Y ) = E [ E [ X 2 Y | X ] ] = E [ X 2 E [ Y | X ] ] = 0 c o v ( X Y ) . E ( X ) = 0ρ(XY,X)=0E(X2Y)=E[E[X2Y|X]]=E[X2E[Y|X]]=0cov(XY,X)=E(X2Y)E(XY).E(X)=0


-2

Korelasi Linear antara X dan XY adalah,

Corr (X, XY) = Cov (X, XY) / sqrt (var (X) * var (XY))

Cov (X, XY) = Penjumlahan ((X-mean (X)) (XY-mean (XY)) / n

n - ukuran sampel; var (X) = varian X; var (XY) = varian XY


1
Pertanyaannya adalah tentang variabel acak , bukan tentang data.
whuber

bagaimana kita dapat menemukan apakah 2 variabel acak berkorelasi atau tidak? Hanya data yang benar. Koreksi saya jika saya salah. Permintaan maaf.
Sam Gladio

Satu menghitung korelasi secara teoritis, menggunakan sifat matematika dari variabel acak. Ini sangat mirip dengan, katakanlah, menghitung kekuatan desain jembatan menggunakan prinsip-prinsip mekanika Newton, dibandingkan dengan membangun jembatan dan mengujinya: ada peran yang berbeda untuk teori dan data dan mereka tidak boleh bingung satu sama lain .
whuber
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.