Bagaimana cara menggunakan filter stopwords khusus di Java Weka API?


8

Saya menggunakan Java Weka API untuk membangun model klasifikasi. Saya dapat menggunakan filter stopwords bawaan. Namun, saya perlu menggunakan filter khusus untuk masalah saya. Saya tidak tahu cara menggunakan filter stopwords khusus di Java Weka API.

Jawaban:


7

Anda dapat mencoba kode berikut.

import weka.core.converters.ConverterUtils.DataSource;
import weka.filters.unsupervised.attribute.StringToWordVector;
import weka.core.Instances;

Instances data = DataSource.read(".../document.txt"); //Your document .
filter.setInputFormat(data);
StringToWordVector filter = new StringToWordVector();
filter.setStopwords(new File(".../stopwords.txt")); //stop words file.
Instances data = Filter.useFilter(data,filter);

Anda juga dapat membaca dokumen berikut untuk pemahaman yang lebih baik tentang API Weka untuk Java. http://weka.sourceforge.net/doc.stable/


Saya menghargai dukungan Anda. Terima kasih banyak. Kode Anda dan tautan dokumen sangat membantu saya.
Radia Karim

7

Pertama-tama Anda harus menyiapkan file teks untuk stopwords khusus Anda. Kemudian Anda dapat menggunakan kode berikut:

import weka.filters.unsupervised.attribute.StringToWordVector;

StringToWordVector filter = new StringToWordVector(10000);
filter.setStopwords(new File(".../stopwords.txt"));

Semoga ini bisa membantu Anda.


Saya menghargai dukungan Anda.
Radia Karim

Saya sangat baru dalam pemrograman Java weka-api. Saya tidak mengerti dengan jelas. Siapa pun tolong berikan saya jawaban yang sedikit lebih rumit. Terima kasih sebelumnya atas dukungan Anda.
Radia Karim

Beri tahu kami bagian mana yang tidak Anda mengerti?
Rejaul Karim
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.