Contoh dua * variabel berkorelasi * normal yang jumlahnya tidak normal


10

Saya menyadari beberapa contoh yang bagus dari pasangan variabel acak berkorelasi yang secara normal normal tetapi tidak secara normal normal. Lihat jawaban ini oleh Dilip Sarwate , dan yang ini oleh Cardinal .

Saya juga mengetahui contoh dua variabel acak normal yang jumlahnya tidak normal. Lihat jawaban ini oleh Makro . Tetapi dalam contoh ini, dua variabel acak tidak berkorelasi.

Apakah ada contoh dari dua variabel acak normal yang memiliki kovarian non-nol dan yang jumlahnya tidak normal? Atau mungkinkah untuk membuktikan bahwa jumlah dari dua variabel acak normal berkorelasi, bahkan jika mereka bukan normal bivariat, harus normal?

[Konteks: Saya punya pertanyaan PR yang meminta distribusi di mana X dan Y yang normals standar dengan korelasi ρ . Saya pikir pertanyaan yang dimaksudkan untuk menentukan bahwa mereka normal bivariat. Tapi aku bertanya-tanya apakah ada yang bisa dikatakan tanpa asumsi tambahan ini untuk ρ non-nol.]aX+bYXYρρ

Terima kasih!


5
Jawaban Cardinal, yang Anda kutip, sudah berisi solusi: lihat sudut kanan atas di panel contohnya.
whuber

Bisakah Anda jelaskan caranya? Dia menentukan distribusi bersama , yang menghasilkan dua marjinal normal. Tidak jelas bagi saya bahwa jumlah dari dua marginal normal tidak normal, yang saya cari. (Lihat juga komentar saya pada jawaban Glen_b di bawah ini.)
mww

3
Dari gambar saja jelas bahwa kepadatan jumlah di nol adalah nol (karena garis memotong plot dalam satu titik, yang memiliki ukuran nol), sedangkan jumlah itu sendiri sama jelasnya simetris tentang nol, menunjukkan bahwa nol adalah pusat distribusi jumlah. Distribusi seperti itu tidak bisa Normal karena distribusi Normal memiliki kepadatan nol di pusatnya. x+y=0
whuber

Jawaban:


11

Hampir setiap kopula bivariat akan menghasilkan sepasang varian acak normal dengan beberapa korelasi nol (beberapa akan memberikan nol tetapi mereka adalah kasus khusus). Sebagian besar (hampir semua) dari mereka akan menghasilkan jumlah yang tidak normal.

Dalam beberapa keluarga kopula, korelasi Spearman (populasi) yang diinginkan dapat dihasilkan; kesulitannya hanya dalam menemukan korelasi Pearson untuk margin normal; itu bisa dilakukan secara prinsip, tetapi aljabar mungkin cukup rumit secara umum. [Namun, jika Anda memiliki korelasi populasi Spearman, korelasi Pearson - setidaknya untuk margin ekor ringan seperti Gaussian - mungkin tidak terlalu jauh dari itu dalam banyak kasus.]

Semua kecuali dua contoh pertama dalam plot kardinal harus memberikan jumlah yang tidak normal.


Beberapa contoh - dua yang pertama keduanya berasal dari keluarga kopula yang sama dengan yang kelima dari contoh distribusi bivariat kardinal, yang ketiga adalah degenerasi.

Contoh 1:

Clayton copula ( )θ=0.7

histogram margin normal, jumlah & plot non-normal distribusi bivariat

Di sini jumlahnya sangat jelas memuncak dan cukup condong ke kanan

 

Contoh 2:

Clayton copula ( )θ=2

histogram margin normal, jumlah & plot non-normal distribusi bivariat

Di sini jumlahnya sedikit miring. Kalau-kalau itu tidak terlalu jelas bagi semua orang, di sini saya membalik distribusi (yaitu kita memiliki histogram dalam warna ungu pucat) dan melapisinya sehingga kita dapat melihat asimetri lebih jelas:(x+y)

histogram yang ditumpangkan dari x + y dan - (x + y)

 

X=XY=Y

Di sisi lain jika kita hanya meniadakan salah satunya, kita akan mengubah hubungan antara kekuatan skewness dengan tanda korelasinya (tetapi bukan arahnya).

Layak juga bermain-main dengan beberapa kopula berbeda untuk mengetahui apa yang bisa terjadi dengan distribusi bivariat dan margin normal.

Margin Gaussian dengan t-kopula dapat dicoba dengan, tanpa perlu khawatir banyak tentang detail kopula (menghasilkan dari t bivariat berkorelasi, yang mudah, kemudian mentransformasikannya ke margin seragam melalui probabilitas integral transformasi, kemudian mentransformasikan margin seragam ke Gaussian melalui invers cdf normal). Ini akan memiliki jumlah non-normal-tetapi-simetris. Jadi, bahkan jika Anda tidak memiliki paket kopula yang bagus, Anda masih dapat melakukan beberapa hal dengan cukup mudah (misalnya jika saya mencoba untuk menunjukkan contoh dengan cepat di Excel, saya mungkin akan mulai dengan t-kopula).

-

Contoh 3 : (ini lebih seperti apa yang seharusnya saya mulai dengan awalnya)

UV=U0U<12V=32U12U1UVX=Φ1(U),Y=Φ1(V)X+Y

masukkan deskripsi gambar di sini

Dalam hal ini korelasi di antara mereka adalah sekitar 0,66.

XY

U(12c,12+c)c[0,12]V


Beberapa kode:

library("copula")
par(mfrow=c(2,2))

# Example 1
U <- rCopula(100000, claytonCopula(-.7))
x <- qnorm(U[,1])
y <- qnorm(U[,2])
cor(x,y)
hist(x,n=100)
hist(y,n=100)
xysum <- rowSums(qnorm(U))
hist(xysum,n=100,main="Histogram of x+y")
plot(x,y,cex=.6,
       col=rgb(0,100,0,70,maxColorValue=255),
       main="Bivariate distribution")
text(-3,-1.2,"cor = -0.68")
text(-2.5,-2.8,expression(paste("Clayton: ",theta," = -0.7")))

Contoh kedua:

#--
# Example 2:
U <- rCopula(100000, claytonCopula(2))
x <- qnorm(U[,1])
y <- qnorm(U[,2])
cor(x,y)
hist(x,n=100)
hist(y,n=100)
xysum <- rowSums(qnorm(U))
hist(xysum,n=100,main="Histogram of x+y")
plot(x,y,cex=.6,
    col=rgb(0,100,0,70,maxColorValue=255),
    main="Bivariate distribution")
text(3,-2.5,"cor = 0.68")
text(2.5,-3.6,expression(paste("Clayton: ",theta," = 2")))
#
par(mfrow=c(1,1))

Kode untuk contoh ketiga:

#--
# Example 3:
u <- runif(10000)
v <- ifelse(u<.5,u,1.5-u)
x <- qnorm(u)
y <- qnorm(v)
hist(x+y,n=100)

X+Y=2IZ+(1I)U+(1I)VI=0U+VI=12Zdistribusi tidak normal.
mww

ρ

Saya telah mengganti contoh dengan dua contoh spesifik menggunakan Clayton copulas
Glen_b -Reinstate Monica

Luar biasa - terima kasih! Terima kasih utama untuk kode R.
mww

Saya menambahkan contoh ketiga dan pada akhirnya saya menguraikan cara untuk mendapatkan sesuatu seperti apa yang awalnya saya coba - cara untuk mendapatkan korelasi merdu antara -1 dan 1 (selain dari kasus-kasus khusus di ujung), tetapi untuk itu jumlahnya tidak normal.
Glen_b -Reinstate Monica

-1

Saya datang dengan satu contoh. X adalah variabel normal standar, dan Y = -X. Kemudian X + Y = 0, yang konstan. Adakah yang bisa mengonfirmasikan bahwa itu adalah sampel balik?

Kita tahu fakta jika X, Y secara bersama-sama normal, maka jumlah mereka juga normal. Tetapi bagaimana jika korelasinya -1?

Saya sedikit bingung tentang ini. Terima kasih.


Anda mendapatkan hal yang sama benar ketika X = Y dan kemudian XY = 0. Ini adalah distribusi normal yang tidak normal bivariat. Oleh karena itu, properti yang kombinasi liniernya adalah normal yang berlaku untuk normal bivariat tidak perlu diterapkan.
Michael R. Chernick

σ0
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.