Apakah ada hubungan antara kesamaan cosinus, korelasi pearson, dan skor-z?


16

Saya bertanya-tanya apakah ada hubungan di antara 3 ukuran ini. Saya sepertinya tidak bisa membuat hubungan di antara mereka dengan merujuk pada definisi (mungkin karena saya baru dengan definisi ini dan saya mengalami sedikit waktu sulit memahami mereka).

Saya tahu kisaran kesamaan cosinus dapat dari 0 - 1, dan bahwa korelasi pearson dapat berkisar dari -1 hingga 1, dan saya tidak yakin pada kisaran skor-z.

Namun, saya tidak tahu bagaimana nilai kesamaan cosinus tertentu dapat memberi tahu Anda apa pun tentang korelasi pearson atau skor-z, dan sebaliknya?


1
z skor apa ? z skor beberapa hal mungkin terkait dengan korelasi Pearson, skor Z hal lain mungkin tidak. Misalnya, jika Anda menstandarkan secara internal variabel asli Anda, maka korelasi Pearson antara x dan y adalah produk yang diharapkan dari skor-z mereka. Atau Anda mungkin berbicara tentang z-skor dari korelasi Pearson (korelasi Pearson dikurangi harapan mereka di bawah beberapa kondisi semua dibagi dengan standard error korelasi Pearson), yang tentu akan terkait dengan korelasi Pearson.
Glen_b -Reinstate Monica

Jawaban:


29

The cosine similarity antara dua vektor dan b hanya sudut antara mereka cos θ = a bab Dalam banyak aplikasi yang menggunakan kesamaan cosinus, vektor-vektornya tidak negatif (misalnya vektor frekuensi istilah untuk sebuah dokumen), dan dalam hal ini kesamaan cosinus juga akan menjadi non-negatif.

cosθ=abab

Untuk vektor vektor " z -score" biasanya akan didefinisikan sebagai z = x - ˉ xxz mana ˉ x =1

z=xx¯sx
dans 2 x = ¯ ( x - ˉ x ) 2 adalah mean dan standar deviasix. Jadizmemiliki mean 0 dan standar deviasi 1, yaituzxadalahversistandarx.x¯=1nixisx2=(xx¯)2¯xzzxx

xy

ρx,y=(zxzy)¯

asa2=1na2

a^=aa=zan

ab

n


+1. komentar latexnazi: \|sering terlihat lebih baik daripada ||, dan \lVert ... \rVertmerupakan cara terbaik untuk menulisnya.
Amuba mengatakan Reinstate Monica
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.