Saya baru saja membaca empat buku di bidang ini:
Feldman, R. dan James Sanger, J. (2006). Buku Pegangan Penambangan Teks: Pendekatan Lanjutan dalam Menganalisis Data Tidak Terstruktur. Cambridge University Press.
Yang ini berfokus pada contoh-contoh praktis, perangkat lunak dan penambangan teks terapan. Ini memberikan beberapa contoh penggunaan praktis penambangan teks. Mungkin menarik jika Anda ingin membaca tentang aplikasi komersial alat penambangan teks.
Srivastava, AN dan Sahami, M. (2009). Penambangan Teks: Klasifikasi, Klaster, dan Aplikasi. Chapman & Hall / CRC.
Ini adalah serangkaian makalah penelitian yang digunakan sebagai contoh penggunaan berbagai alat penambangan teks. Itu agak terlalu fokus untuk tes pengantar.
Weiss, SM, Indurkhya, N., Zhang, T. dan Damerau, F. (2005). Penambangan Teks: Metode Prediktif untuk Menganalisis Informasi Tidak Terstruktur.
Peloncat.
Teks yang sangat pengantar yang menjelaskan beberapa masalah umum.
Manning, C. (1999). Yayasan Pengolahan Bahasa Alam Statistik. MIT Press.
Ini adalah buku terbaik yang sudah saya baca tentang topik ini. Itu ditulis dengan baik, jelas, masuk lebih dalam ke teori tetapi dengan cara yang ramah praktik. Mulai dengan pengantar umum, tetapi kemudian mengulas beberapa metode dan algoritma yang paling umum digunakan. Jika Anda harus memilih hanya satu buku, saya akan merekomendasikan buku ini.
Anda juga dapat dengan mudah menemukan banyak buku tentang pemrosesan bahasa alami dan penggalian teks yang berfokus pada penggunaan R ( tm library) atau Python ( perpustakaan nltk ).