Saya telah membangun beberapa jaringan saraf (MLP (terhubung penuh), Elman (berulang)) untuk tugas yang berbeda, seperti bermain Pong, mengklasifikasikan angka tulisan tangan dan lainnya ...
Selain itu saya mencoba untuk membangun beberapa jaringan saraf convolutional pertama, misalnya untuk mengklasifikasikan catatan tulisan tangan multi-digit, tetapi saya benar-benar baru untuk menganalisis dan mengelompokkan teks, misalnya dalam tugas pengenalan / pengelompokan gambar seseorang dapat mengandalkan input standar, seperti gambar berukuran 25x25, RGB atau skala abu-abu dan sebagainya ... ada banyak fitur pra-asumsi.
Untuk penggalian teks, misalnya artikel berita, Anda memiliki ukuran input yang terus berubah (kata yang berbeda, kalimat berbeda, panjang teks berbeda, ...).
Bagaimana seseorang dapat mengimplementasikan alat penambangan teks modern yang memanfaatkan kecerdasan buatan, lebih disukai jaringan saraf / SOM?
Sayangnya saya tidak dapat menemukan tutorial sederhana untuk memulai. Makalah ilmiah yang kompleks sulit dibaca dan bukan pilihan terbaik untuk mempelajari suatu topik (menurut pendapat saya). Saya sudah membaca beberapa makalah tentang MLP, teknik putus sekolah, jaringan saraf convolutional dan sebagainya, tetapi saya tidak dapat menemukan yang mendasar tentang penambangan teks - semua yang saya temukan adalah tingkat yang terlalu tinggi untuk keterampilan penambangan teks yang sangat terbatas.