Pertanyaan yang diberi tag «nlp»

Pemrosesan bahasa alami (NLP) adalah subbidang kecerdasan buatan yang melibatkan transformasi atau penggalian informasi yang berguna dari data bahasa alami. Metode termasuk pembelajaran mesin dan pendekatan berbasis aturan.

18
Bagaimana cara Google “Maksud Anda?” Algoritma bekerja?
Saya telah mengembangkan situs web internal untuk alat manajemen portofolio. Ada banyak data teks, nama perusahaan, dll. Saya sangat terkesan dengan beberapa kemampuan mesin pencari untuk dengan cepat menanggapi pertanyaan dengan "Apakah maksud Anda: xxxx". Saya harus dapat dengan cerdas mengambil kueri pengguna dan merespons dengan tidak hanya hasil pencarian …


10
Java Stanford NLP: Bagian dari label Pidato?
Stanford NLP, demo'd di sini , memberikan output seperti ini: Colorless/JJ green/JJ ideas/NNS sleep/VBP furiously/RB ./. Apa arti dari tag Bagian Bicara? Saya tidak dapat menemukan daftar resmi. Apakah itu sistem Stanford sendiri, atau apakah mereka menggunakan tag universal? (Apa JJ, misalnya?) Juga, ketika saya mengulangi kalimat, mencari kata benda, …

15
Mendeteksi suku kata dalam satu kata
Saya perlu menemukan cara yang cukup efisien untuk mendeteksi suku kata dalam sebuah kata. Misalnya, Tak terlihat -> in-vi-sib-le Ada beberapa aturan silabifikasi yang dapat digunakan: V CV VC CVC CCV CCCV CVCC * di mana V adalah vokal dan C adalah konsonan. Misalnya, Pengucapan (5 Pro-nun-ci-a-tion; CV-CVC-CV-V-CVC) Saya telah …



11
Bagaimana cara menghilangkan tanda baca menggunakan NLTK tokenizer?
Saya baru mulai menggunakan NLTK dan saya tidak begitu mengerti bagaimana cara mendapatkan daftar kata dari teks. Jika saya menggunakan nltk.word_tokenize(), saya mendapatkan daftar kata dan tanda baca. Saya hanya membutuhkan kata-kata saja. Bagaimana cara menghilangkan tanda baca? Juga word_tokenizetidak berfungsi dengan beberapa kalimat: titik ditambahkan ke kata terakhir.
125 python  nlp  tokenize  nltk 


2
Java atau Python untuk Pemrosesan Bahasa Alami [tutup]
Tertutup . Pertanyaan ini berdasarkan opini . Saat ini tidak menerima jawaban. Ingin memperbaiki pertanyaan ini? Perbarui pertanyaan agar dapat dijawab dengan fakta dan kutipan dengan mengedit posting ini . Tutup 6 tahun lalu . Perbaiki pertanyaan ini Saya ingin tahu bahasa pemrograman mana yang lebih baik untuk pemrosesan bahasa …
112 java  python  nlp 

21
Bagaimana cara melakukan Word Stemming atau Lemmatization?
Saya sudah mencoba PorterStemmer dan Snowball tetapi keduanya tidak bekerja pada semua kata, kehilangan beberapa kata yang sangat umum. Kata-kata pengujian saya adalah: " kucing menjalankan komunitas komunitas komunitas kaktus kaktus kaktus ", dan keduanya mendapatkan kurang dari setengah benar. Lihat juga: Algoritma stemming yang menghasilkan kata-kata nyata Stemming - …

4
Bagaimana cara menghitung presisi, recall, akurasi, dan skor f1 untuk kasus multiclass dengan scikit learn?
Saya sedang mengerjakan masalah analisis sentimen, datanya terlihat seperti ini: label instances 5 1190 4 838 3 239 1 204 2 127 Jadi data saya tidak seimbang sejak 1190 instancesdiberi label 5. Untuk klasifikasi saya menggunakan SVC scikit . Masalahnya adalah saya tidak tahu bagaimana menyeimbangkan data saya dengan cara …

3
Bagaimana cara melatih Stanford Parser dengan Genia Corpus?
Saya memiliki beberapa masalah dalam membuat model baru untuk Stanford Parser. Saya juga telah mengunduh versi terakhir dari Stanford: http://nlp.stanford.edu/software/lex-parser.shtml Dan di sini, Genia Corpus dalam 2 format, xml dan ptb (Penn Treebank). Parser Standford dapat berlatih dengan file ptd; kemudian saya mengunduh Genia Corpus, karena saya ingin bekerja dengan …
93 java  nlp  stanford-nlp 




Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.