Pertanyaan saya mungkin konyol. Jadi saya akan minta maaf sebelumnya.
Saya mencoba menggunakan model GLOVE yang sudah dilatih oleh Stanford NLP group ( tautan ). Namun, saya perhatikan bahwa hasil kesamaan saya menunjukkan beberapa angka negatif.
Itu segera mendorong saya untuk melihat file data kata-vektor. Rupanya, nilai-nilai dalam kata vektor diizinkan menjadi negatif. Itu menjelaskan mengapa saya melihat kesamaan cosinus negatif.
Saya terbiasa dengan konsep persamaan cosinus dari vektor frekuensi, yang nilainya dibatasi pada [0, 1]. Saya tahu pasti bahwa fungsi titik produk dan kosinus dapat positif atau negatif, tergantung pada sudut antara vektor. Tetapi saya benar-benar kesulitan memahami dan menafsirkan kesamaan cosinus negatif ini.
Sebagai contoh, jika saya memiliki sepasang kata yang memberikan kesamaan -0.1, apakah mereka kurang serupa daripada pasangan lain yang memiliki kesamaan 0,05? Bagaimana dengan membandingkan kesamaan -0,9 hingga 0,8?
Atau haruskah saya melihat nilai absolut dari perbedaan sudut minimal dari ? Nilai absolut dari skor?
Terima kasih banyak.
An angular-type similarity coefficient between two vectors. It is like correlation, only without centering the vectors.
Satu-satunya perbedaan antara keduanya adalah bahwa dalam penyimpangan korelasi (momen) - yang sedang dikalikan lintas - berasal dari rata-rata, sedangkan dalam penyimpangan cosinus berasal dari 0 asli - yaitu mereka adalah nilai-nilai sebagaimana adanya .