Varians produk k variabel acak berkorelasi


Jawaban:


12

Informasi lebih lanjut tentang topik ini daripada yang mungkin Anda butuhkan dapat ditemukan di Goodman (1962): "Varian Produk K Variabel Acak" , yang memperoleh rumus untuk kedua variabel acak independen dan variabel acak yang berpotensi berkorelasi, bersama dengan beberapa perkiraan. Dalam makalah sebelumnya ( Goodman, 1960 ), rumus untuk produk tepat dua variabel acak diturunkan, yang agak lebih sederhana (meskipun masih cukup rumit), sehingga mungkin tempat yang lebih baik untuk memulai jika Anda ingin memahami derivasi .

Namun, untuk kelengkapan, seperti ini.

Dua variabel

Asumsikan yang berikut:

  • x dan adalah dua variabel acaky
  • X dan adalah harapan mereka (bukan nol)Y
  • V(x) dan adalah varians merekaV(y)
  • δx=(xX)/X (dan juga untuk )δy
  • Di,j=E[(δx)i(δy)j]
  • Δx=xX (dan juga untuk )Δy
  • Ei,j=E[(Δx)i(Δy)j]
  • G(x) adalah koefisien variasi kuadrat: (juga untuk )V(x)/X2G(Y)

Kemudian: atau yang setara:

V(xy)=(XY)2[G(y)+G(x)+2D1,1+2D1,2+2D2,1+D2,2D1,12]

V(xy)=X2V(y)+Y2V(x)+2XYE1,1+2XE1,2+2YE2,1+E2,2E1,12

Lebih dari dua variabel

Makalah 1960 menyarankan bahwa ini merupakan latihan untuk pembaca (yang tampaknya telah memotivasi makalah 1962!).

Notasi serupa, dengan beberapa ekstensi:

  • (x1,x2,xn) menjadi variabel acak alih-alih danxy
  • M=E(i=1kxi)
  • A=(M/i=1kXi)1
  • si = 0, 1, atau 2 untuki=1,2,k
  • u = jumlah 1 dalam(s1,s2,sk)
  • m = jumlah 2 dalam(s1,s2,sk)
  • D(u,m)=2u2 untuk dan untuk ,m=02um>1
  • C(s1,s2,,sk)=D(u,m)E(i=1kδxisi)
  • s1sk menunjukkan penjumlahan dari set mana3kk1(s1,s2,sk)2m+u>1

Lalu, akhirnya:

V(i=1kxi)=Xi2(s1skC(s1,s2sk)A2)

Lihat makalah untuk detail dan perkiraan yang sedikit lebih traktat!


harap dicatat, bahwa jawaban di atas dari Matt Krause berisi kesalahan serta kertas itu sendiri. Dalam definisi fungsi C (s1, ..., sk) itu harus merupakan produk, bukan penjumlahan.
Nicolas Gisler

Bisakah Anda menguraikan lebih sedikit ..? "Karena saya - orang anonim dari Internet - mengatakan demikian" sebenarnya bukan jawaban ...
Tim

Jika Anda mencoba untuk mendapatkan varians var (x * y) untuk variabel acak independen, melalui rumus untuk arbitrary k Anda dapat melihat bahwa hanya produk dan bukan jumlah yang memberi Anda jawaban yang benar. Selain itu, jika Anda melihat kertas Anda juga bisa melihatnya, di halaman 59 dari kertas (setidaknya dalam versi saya) ia menggunakan produk bukan jumlah.
Nicolas Gisler

1
Untuk kasus dua variabel acak, rumus yang lebih mudah dibaca untuk varian produk dari dua variabel acak berkorelasi dapat ditemukan dalam jawaban ini oleh @macro. Jawaban ini juga menunjukkan masalah penting dalam yaitu, notasi menyembunyikan fakta penting bahwa ada istilah di dalamnya yang nilainya tidak dapat ditentukan kecuali kita tahu cov , atau cukup tentang kepadatan bersama dari dua variabel acak untuk menentukan jumlah ini.
V(xy)=X2V(y)+Y2V(x)+2XYE1,1+2XE1,2+2YE2,1+E2,2E1,12,
(x2,y2)
Dilip Sarwate

Saran edit, yang seharusnya benar-benar menjadi komentar, menyarankan bahwa kertas asli berisi kesalahan ketik di mana jumlah dan produk dicampur dan jawaban ini harus diubah. Lihat stats.stackexchange.com/review/suggested-edits/83662
Silverfish

4

Hanya untuk menambah jawaban Matt Krause yang luar biasa (sebenarnya mudah didapat dari sana). Jika x, y independen maka,

E1,1=E[(xE[x])(yE[y])]=Cov(x,y)=0E1,2=E[(xE[x])(yE[y])2]=E[xE(x)]E[(yE[y])2]=(E[x]E[x])E[(yE[y])2]=0E2,1=0E2,2=E[(xE[x])2(yE[y])2]=E[(xE[x])2]E[(yE[y])2=V[x]V[y]V[xy]=E[x]2V[y]+E[y]2V[x]+V[x]V[y]

1
Hasil untuk kasus variabel acak independen telah dibahas di sini . n
Dilip Sarwate

3

Selain rumus umum yang diberikan oleh Matt mungkin perlu dicatat bahwa ada rumus yang agak lebih eksplisit untuk nol berarti variabel acak Gaussian. Ini mengikuti dari teorema Isserlis , lihat juga Momen yang lebih tinggi untuk distribusi normal multivariat terpusat.

Misalkan mengikuti distribusi normal multivariat dengan rata-rata 0 dan matriks kovarian . Jika jumlah variabel ganjil, dan mana berarti menjumlahkan semua partisi menjadi pasangan yang terpisah dengan setiap istilah sebagai produk dari 's yang sesuai, dan di mana (x1,,xk)ΣkE(ixi)=0

V(ixi)=E(ixi2)=Σ~i,j
Σ{1,,2k}k{i,j}k Σ~i,j
Σ~=(ΣΣΣΣ)
adalah matriks kovarian untuk . Jika adalah genap, Dalam kasus kita mendapatkan Jika kita mendapatkan mana ada 15 istilah dalam jumlah.(x1,,xk,x1,,xk)k
V(ixi)=Σ~i,j(Σi,j)2.
k=2
V(x1x2)=Σ1,1Σ2,2+2(Σ1,2)2Σ1,22=Σ1,1Σ2,2+(Σ1,2)2.
k=3
V(x1x2x3)=Σi,jΣk,lΣr,t,

Pada kenyataannya, dimungkinkan untuk mengimplementasikan formula umum. Bagian yang paling sulit tampaknya adalah perhitungan dari partisi yang diperlukan. Dalam R, ini bisa dilakukan dengan fungsi setpartsdari paket partitions. Dengan menggunakan paket ini, tidak ada masalah untuk menghasilkan 2.027.025 partisi untuk , 34.459.425 partisi untuk juga dapat dihasilkan, tetapi bukan partisi 654.729.075 untuk (pada laptop 16 GB saya).k=8k=9k=10

Beberapa hal lain perlu diperhatikan. Pertama, untuk variabel Gaussian dengan non-zero mean harus dimungkinkan untuk mendapatkan ekspresi juga dari teorema Isserlis '. Kedua, tidak jelas (bagi saya) apakah rumus di atas kuat terhadap penyimpangan dari normalitas, yaitu, jika dapat digunakan sebagai perkiraan bahkan jika variabel multivariat tidak terdistribusi secara normal. Ketiga, meskipun formula di atas benar, patut dipertanyakan berapa banyak varian mengatakan tentang distribusi produk. Bahkan untuk distribusi produk cukup leptokurtik, dan untuk lebih besar dengan cepat menjadi sangat leptokurtik.kk=2k


Pendekatan yang rapi! Betapapun nilainya, rumus dalam jawaban saya juga memiliki kombinasi kombinatorial: penjumlahan atas C melibatkan menjumlahkan istilah . O(3k)
Matt Krause
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.