Pertanyaan yang diberi tag «word-embeddings»

Penyematan kata adalah nama kolektif untuk sekumpulan pemodelan bahasa dan teknik pembelajaran fitur di NLP di mana kata-kata dipetakan ke vektor bilangan real dalam ruang berdimensi rendah, relatif terhadap ukuran kosa kata.

2
Menangani kata-kata yang tidak dikenal dalam tugas pemodelan bahasa menggunakan LSTM
Untuk tugas pemrosesan bahasa alami (NLP) seseorang sering menggunakan vektor word2vec sebagai embedding kata-kata. Namun, mungkin ada banyak kata yang tidak dikenal yang tidak ditangkap oleh vektor word2vec hanya karena kata-kata ini tidak cukup sering terlihat dalam data pelatihan (banyak implementasi menggunakan jumlah minimum sebelum menambahkan kata ke dalam kosakata). …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.