Mengabaikan kemungkinan pembatasan komputasi, apakah ada aplikasi umum di mana lemmatization akan menjadi langkah kontraproduktif ketika menganalisis data teks?
Misalnya, apakah lemmatisasi akan menjadi sesuatu yang tidak dilakukan ketika membangun model yang sadar konteks?
Untuk referensi, lemmatization per dictinory.com adalah tindakan pengelompokan bersama bentuk-bentuk infleksi (kata) untuk analisis sebagai satu item.
Misalnya, kata 'masak' adalah lemma dari kata 'memasak'. Tindakan lemmatization, misalnya, mengganti kata memasak dengan juru masak setelah Anda tokenized data teks Anda. Selain itu, kata 'buruk' memiliki 'buruk' sebagai lemma-nya, dan sebagai contoh sebelumnya menggantikan kata 'buruk' dengan 'buruk' adalah tindakan lemasiasi.