Apakah ada artikel atau diskusi tentang penggalian bagian teks yang paling banyak menyimpan informasi tentang dokumen saat ini.
Misalnya, saya memiliki kumpulan besar dokumen dari domain yang sama. Ada bagian teks yang menyimpan informasi penting yang dibicarakan oleh satu dokumen. Saya ingin mengekstrak beberapa bagian itu dan menggunakannya sebagai ringkasan teks. Apakah ada dokumentasi yang berguna tentang cara mencapai sesuatu seperti ini.
Akan sangat membantu jika seseorang bisa mengarahkan saya ke arah yang benar apa yang harus saya cari atau baca untuk mendapatkan beberapa wawasan dalam pekerjaan yang mungkin telah dilakukan dalam bidang pemrosesan bahasa alami ini.