3
Model basis data yang efisien untuk menyimpan data yang diindeks oleh n-gram
Saya sedang mengerjakan sebuah aplikasi yang membutuhkan pembuatan database n-gram yang sangat besar yang ada dalam corpus teks besar. Saya membutuhkan tiga jenis operasi yang efisien: Pencarian dan penyisipan diindeks oleh n-gram itu sendiri, dan permintaan untuk semua n-gram yang berisi sub-n-gram. Bagi saya ini kedengarannya seperti database harus pohon …