Distribusi macam apa ini? tetapi

8

Saya menghadapi distribusi terbatas dengan nol kovarians antara dua variabel tetapi korelasinya adalah . Apakah ada distribusi seperti itu? Bagaimana bisa dijelaskan? $1$

Anda benar, mungkin saya perlu memberikan lebih banyak detail. OK, X dan Y adalah distribusi normal bivariat dengan varians dan rata-rata yang berbeda (bebas n) tetapi corr = 1- (1 / n), sekarang selidiki distribusi terbatas Yn | Xn = x.

— Behgol
sumber

24

Distribusi itu disebut kesalahan komputasi .

— Memiliki QUIT - Anony-Mousse

5

Tolong berikan detailnya untuk menyelesaikan perbedaan yang terlihat. Apa situasinya?

— Glen_b -Reinstate Monica

Harap berikan lebih detail tentang distribusi gabungan dan . Secara khusus, apa yang menyebabkan ?

X_{n}

$X_n$

Y_{n}

$Y_n$

ρ_{n} = 1 - 1 / n

$\rho_n=1-1/n$

— Mico

Sayangnya, saya tidak punya detail lebih lanjut. Pertanyaan Anda adalah pertanyaan yang saya pikirkan juga. Bagaimana ρn tergantung pada n ketika varians bebas dari n? dan apa artinya sebenarnya?

— Behgol

Menurut Anda mengapa kovarians adalah ?

0

$0$

— Juho Kokkala

5

Setelah klarifikasi oleh OP, tampak bahwa a) kami berasumsi bahwa dua variabel mengikuti bersama normal bivariat dan b) minat kami adalah pada distribusi bersyarat, yang kemudian

Y_{n} ∣ X_{n} = x \sim N (μ_{y} + \frac{σ_{y}}{σ_{x}} ρ_{n} (x - μ_{x}), (1 - ρ_{n}^{2}) σ_{y}^{2})

$Y_n\mid X_n=x \ \sim\ \mathcal{N}\left(\mu_y+\frac{\sigma_y}{\sigma_x}\rho_n( x - \mu_x),\, (1-\rho_n^2)\sigma_y^2\right)$

Kemudian kita melihat bahwa sebagai , kita memiliki , dan varians dari distribusi kondisional menjadi nol. Secara intuitif, jika korelasi mengarah ke persatuan, "mengetahui " sudah cukup untuk "mengenal " juga. $n \to \infty$ $\rho_n \to 1$ $x$ $y$

Tapi di mana saja di atas kita tidak mendapatkan bahwa adalah nol. Bahkan pada batas kovarians akan tetap sama dengan . $\text{Cov}(Y_n, X_n)$ $\text{Cov}(Y_n, X_n) \to \sigma_y \sigma_x$

Perhatikan bahwa kovarians kondisional (dan kemudian juga korelasi kondisional) selalu nol, karena,

Cov (Y_{n}, X_{n} ∣ X_{n} = x) = E (Y_{n} X_{n} ∣ X_{n} = x) - E (Y ∣ X_{n} = x) E (X ∣ X_{n} = x)

$\text{Cov}(Y_n, X_n \mid X_n =x) = E(Y_nX_n\mid X_n =x) - E(Y\mid X_n =x) E(X\mid X_n =x)$

= x E (Y_{n} ∣ X_{n} = x) - x E (Y ∣ X_{n} = x) = 0

$=xE(Y_n\mid X_n =x) - xE(Y\mid X_n =x) =0$

Ini terjadi karena dengan memeriksa kita telah mengubah salah satu variabel acak menjadi konstanta, dan konstanta tidak co-variatif dengan apa pun. $X_n = x$

— Alecos Papadopoulos
sumber

Terima kasih atas jawaban anda. Jadi itu adalah distribusi normal tanpa varian? bagaimana bentuknya?

— Behgol

@Behgol lihat en.wikipedia.org/wiki/Dirac_delta_function

— Alecos Papadopoulos

20

Karena kovarians tergantung pada skala $X$ dan $Y$ dan korelasinya tidak (kembali ke $[-1, -1]$ ) itu mungkin. Misalnya, jika varians berkurang ke nol:

Jika $X=Y$ dan $\sigma_x^2$ adalah varian dari $X$ , kemudian $\lim_{\sigma_x^2 \to 0} \operatorname{cov}(X, Y) = 0$ dan . $\lim_{\sigma_x^2 \to 0} \operatorname{cor}(X, Y) = 1$

Catatan 1: ketika korelasinya sangat tidak ditentukan karena penyebutnya sama dengan 0. $\sigma_x^2 = 0$

— Pieter
sumber

Anda benar mungkin saya harus memberikan lebih banyak detail. OK X dan Y distribusi normal arebivarian dengan varians dan rata-rata yang berbeda (bebas n) tetapi corr = 1- (1 / n), sekarang selidiki distribusi terbatas Yn | Xn = x.

— Behgol

Kata-kata "Karena kovarians tergantung pada skala" menyiratkan bahwa ini diberikan dalam pertanyaan. Namun, itu tampaknya lebih dari sekadar pertanyaan. Tampak bagi saya bahwa Anda mendalilkan bahwa ini mungkin terjadi, dengan kesimpulan yang dinyatakan. Perbaiki saya jika itu salah.

— Nick Cox

18

Sejauh yang saya bisa lihat (mungkin di luar beberapa keadaan khusus, tetapi Anda tidak menyebutkan), itu tidak mungkin.

Korelasi adalah kovarians dibagi dengan produk dari dua standar deviasi, jadi jika kovariansnya nol, korelasinya nol (ketika kedua standar deviasi tidak nol) atau tidak terdefinisi (ketika setidaknya satu standar deviasi adalah 0). Seharusnya tidak 1 ketika kovarians adalah 0.

Saya berharap Anda telah membuat beberapa kesalahan dalam analisis Anda atau deskripsi Anda tidak cukup jelas untuk membedakan situasi dengan benar.

— Glen_b -Reinstate Monica
sumber

1

Anda mungkin mengalami kesulitan karena Anda memvisualisasikan data sebagai Gaussian.

Ada kemungkinan bahwa semua data mewakili titik yang sama (meskipun itu akan berlebihan) dan bahwa Anda memiliki dua variabel dengan nama yang berbeda (alias satu sama lain) yang terdiri dari data. Ini akan mengarah pada nol kovarians, dan korelasi 1 secara fundamental, kovarians mewakili bagaimana penyebaran data melintasi ruang fitur, sementara korelasi mewakili seberapa banyak satu variabel bergantung pada yang lain, atau tingkat pengaruh yang mereka miliki satu sama lain. Jika data tidak tersebar sama sekali, maka kovarian harus nol.

CATATAN Namun hal terbaik yang dapat Anda lakukan dengan dataset tersebut hanyalah memprediksi semua poin memiliki output yang sama, yang kemungkinan besar akan memberikan bias tinggi

— RS Nikhil Krishna
sumber

2

Tampaknya ada beberapa hal berbeda yang terjadi dalam jawaban ini, dan saya mengalami kesulitan melihat hubungan. Misalnya, bagaimana paragraf 1 relevan? Bagaimana ayat 3 relevan? Juga, bagaimana Anda sampai pada nol kovarians pada paragraf 2?

— Richard Hardy

Terima kasih @Richard Hardy karena menunjukkannya. Salah satu jawaban lain awalnya menyarankan solusi Gaussian. Itu sebabnya paragraf 1. Dalam paragraf 3, saya hanya memberikan pandangan saya tentang apa yang dapat ia lakukan dengan dataset tersebut. Pada dasarnya, kovarian mewakili bagaimana penyebaran data di seluruh ruang fitur. Jika data tidak tersebar pada, maka kovarian harus nol. Saya telah menambahkan ini ke jawabannya juga

— RS Nikhil Krishna