Apakah ada karakterisasi intuitif korelasi jarak?


14

Saya telah menatap halaman wikipedia untuk korelasi jarak di mana tampaknya ditandai oleh bagaimana hal itu dapat dihitung. Sementara saya bisa melakukan perhitungan, saya berjuang untuk mendapatkan ukuran korelasi jarak dan mengapa perhitungannya terlihat seperti itu.

Apakah ada (atau banyak) karakterisasi yang lebih intuitif dari korelasi jarak yang dapat membantu saya memahami apa yang diukur?

Saya menyadari bahwa meminta intuisi agak kabur, tetapi jika saya tahu intuisi seperti apa yang saya minta, saya mungkin tidak akan bertanya sejak awal. Saya juga akan senang untuk intuisi mengenai kasus korelasi jarak antara dua variabel acak (meskipun korelasi jarak didefinisikan antara dua vektor acak).

Jawaban:


8

Ini jawaban saya tidak menjawab pertanyaan dengan benar. Silakan baca komentar.

Σ(xiμx)(yiμy)μΣdiμxdiμydi

Σdijxdijyd

xy

Dan memang, kovarians biasa lebih besar ketika hubungan lebih dekat menjadi linier sempurna dan varians lebih besar. Jika Anda menstandarkan varian ke unit tetap, kovarian hanya bergantung pada kekuatan hubungan linier, dan itu kemudian disebut korelasi Pearson . Dan, seperti yang kita tahu - dan baru saja mendapat intuisi mengapa - kovarians jarak lebih besar ketika hubungan lebih dekat menjadi kurva sempurna dan penyebaran data lebih besar. Jika Anda menstandarkan spread ke unit tetap, kovarian hanya bergantung pada kekuatan beberapa asosiasi lengkung, dan kemudian disebut korelasi Brown (jarak) .


Paragraf kedua membuatnya klik untuk saya. Saya tidak tahu mengapa saya tidak melihatnya di halaman wikipedia ... Terima kasih!
Rasmus Bååth

Hanya ingin tahu, di mana di en.wikipedia.org/wiki/Brownian_covariance#Distance_covariance adalah pembilang dari contoh Anda (atau bagaimana cara mendapatkan dari pembilang Anda ke versi wikipedia)? Wikipedia hanya menjelaskan cara menghitung kuadrat kovarians jarak dan saya mengalami sedikit kesulitan mencocokkan deskripsi Anda dengan deskripsi di sana ...
Rasmus Bååth

@Rasmus, "rumus pembilang" saya setuju dengan rumus wikipedia kovarians jarak sampel kuadrat. Tapi saya melewatkan satu (penting) nuansa yang jauhdditransformasikan oleh pemusatan ganda. Saya mungkin harus mengedit jawaban saya. Saya berharap dapat menemukan waktu untuk kembali dalam beberapa hari, jika tidak besok.
ttnphns

Ya, pemusatan ganda telah membingungkan saya. Akan sangat terharu jika Anda punya waktu untuk mengklarifikasi itu! :)
Rasmus Bååth

1
Apa yang masih menghindari saya adalah mengapa daya yang lebih rendah, misalnya standarα=1, yang mengecilkan dan menerima penyimpangan yang diperoleh pada pemusatan ganda, menjadikan dCOV statistik yang memiliki properti unik: 0 jika X dan Y secara statistik independen. Karena saya tidak punya intuisi atau pengetahuan tentang itu, saya khawatir paragraf kedua jawaban saya adalah salah tafsir atau penyederhanaan. Karena itu saya cenderung menghapus jawaban saya. Bisakah kamu mengatakan sesuatu?
ttnphns
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.