Mengapa Pearson's ρ hanya merupakan ukuran asosiasi yang lengkap jika distribusi gabungannya normal multivariat?


Jawaban:


15

Mungkin lebih baik untuk memahami "ukuran asosiasi" dalam distribusi multivariat yang terdiri dari semua properti yang tetap sama ketika nilai-nilai diubah dan disensor kembali secara sewenang-wenang. Melakukan hal itu dapat mengubah mean dan varians ke nilai yang diijinkan secara teoritis (varians harus positif; sarana bisa apa saja).

ρ

2


Apakah saya benar bahwa menurut definisi yang Anda terapkan di sini, kovarian tidak akan menjadi ukuran hubungan? Karena itu akan cenderung berkembang seiring varians berkembang.
user1205901

2
Itu betul. Meskipun kovarians jelas terkait dengan ukuran hubungan, itu tidak sendiri karena dipengaruhi oleh faktor-faktor lain juga.
whuber

19

Variasi dapat dikaitkan dengan cara-cara dimana korelasi Pearson sepenuhnya buta.

ρxyz

masukkan deskripsi gambar di sini

Berikut adalah contoh lain dari variasi yang terkait tetapi tidak berkorelasi:

masukkan deskripsi gambar di sini

(Poin yang mendasar adalah tentang distribusi, meskipun saya menggambarkannya dengan data di sini.)

Bahkan ketika variasinya dikorelasikan, korelasi Pearson secara umum tidak memberi tahu Anda caranya - Anda bisa mendapatkan bentuk asosiasi yang sangat berbeda yang memiliki korelasi Pearson yang sama, (tetapi ketika variasinya multivariat normal, segera setelah saya memberi tahu Anda) korelasi yang dapat Anda katakan dengan tepat bagaimana varians terstandarisasi terkait).

ρ

(Cara umum untuk mengatasi hubungan multivarian adalah melalui kopula. Ada banyak pertanyaan di situs yang terkait dengan kopula; Anda mungkin menemukan beberapa di antaranya bermanfaat)


Apakah ada data dunia nyata dengan distribusi seperti itu?

@ apa ada data dunia nyata yang diambil dari distribusi normal? Saya ragu, jadi (karena marginal saya semua normal dalam diagram) yang akan membuat jawaban "tidak" segera. Inti dari contoh ini adalah untuk menunjukkan dengan jelas mengapa hubungan antara variabel acak tidak sesederhana yang kadang-kadang diasumsikan (seberapa sering orang menghitung korelasi Pearson untuk mengukur hubungan? Cukup sering), dan juga menunjukkan bahwa memiliki margin normal dan multivariat normal berbeda. Contoh yang sangat nyata di mana korelasi Pearson tidak menangkap apa yang terjadi tentu saja terjadi.
Glen_b -Reinstate Monica

Mari kita tidak bicara tentang distribusi sejenak. Ketika kita menghitung korelasi dari titik awan, kita mengasumsikan "ideal geometris" (linear, hiperbolik, logaritmik, sinus, dll) yang mendasarinya dari mana titik-titik di awan menyimpang karena beberapa "kesalahan". Sekarang semua bentuk ideal yang saya lihat diabstraksi dari data nyata di mana kontinu (tanpa jeda) dan selalu meningkat setidaknya satu sumbu (yaitu, bukan, misalnya, melingkar). Pengetahuan saya tentang data terbatas, jadi saya bertanya-tanya apakah sebenarnya ada data dunia nyata yang korelasinya tidak berkelanjutan atau melingkar.

Misalnya, mungkin ada data bahwa jika saya memplotnya akan terlihat seperti dua titik awan. Jika saya secara buta menghitung korelasi pada data ini, saya mungkin menemukan satu, sementara (atau jadi saya telah diberitahu) plot jelas menunjukkan bahwa saya kehilangan beberapa variabel pengganggu yang tidak diketahui yang, jika saya bertanggung jawab untuk itu, akan menyelesaikan hubungan palsu di saya data. Jika profesor saya melihat contoh berbentuk "x" atau "y" Anda, dia akan memberi tahu saya bahwa saya memiliki dua himpunan bagian data yang berbeda.
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.