Istilah-istilah ini sering dilontarkan bersama, tetapi saya ingin tahu apa yang Anda pikirkan perbedaannya, jika ada.
Terima kasih
Istilah-istilah ini sering dilontarkan bersama, tetapi saya ingin tahu apa yang Anda pikirkan perbedaannya, jika ada.
Terima kasih
Jawaban:
LSA dan LSI sebagian besar digunakan secara sinonim, dengan komunitas pengambilan informasi biasanya menyebutnya sebagai LSI. LSA / LSI menggunakan SVD untuk menguraikan matriks dokumen-jangka A menjadi matriks konsep-jangka U, matriks nilai singular S, dan matriks dokumen-konsep V dalam bentuk: A = USV '. Halaman wikipedia memiliki deskripsi rinci tentang pengindeksan semantik laten .
Khususnya ketika LSA dan LSI menggunakan SVD untuk melakukan sihirnya, ada metode yang secara komputasional dan lebih sederhana yang disebut HAL (Hyperspace Analogue to Language) yang menyaring teks yang melacak konteks sebelum dan sesudahnya. Vektor diekstraksi dari matriks kejadian bersama ini (sering kali berbobot) dan kata-kata spesifik dipilih untuk mengindeks ruang semantik. Dalam banyak hal saya diberikan untuk memahaminya berkinerja sebaik LSA tanpa memerlukan langkah rumit SVD secara matematis / konseptual. Lihat Lund & Burgess, 1996 untuk detailnya.
NMF dan SVD keduanya adalah algoritma faktorisasi matriks. Wikipedia memiliki beberapa informasi yang relevan tentang NMF .
SVD dan PCA saling terkait erat. Sebagai permulaan, PCA hanyalah komposisi awal dari korelasi. SVD adalah generalisasi komposisi eigend ke matriks non-kuadrat. Nilai singular adalah akar kuadrat dari nilai eigen dari matriks dikalikan dengan transposnya (menjadikannya kuadrat, dan dapat menerima komposisi eigend). Selanjutnya, jika matriksnya normal (), nilai singular hanyalah nilai absolut dari nilai eigen. Bagaimanapun, nilai singular adalah non-negatif, dan kehilangan tanda nilai eigen adalah harga yang Anda bayar untuk dapat bekerja dengan matriks non-square.
Responden lain telah meliput LSI / LSA ...