Saya bekerja dengan data urutan yang merupakan daftar panjang panggilan win-api malware. Saya mencoba memasukkan masalah mengidentifikasi 'perilaku malware' ke dalam salah satu pola pencarian berurutan. Saya memperlakukan setiap panggilan api sebagai Itemet item tunggal. Jumlah item yang mungkin berbeda (panggilan api) cukup besar.
Sekarang, ketika saya menerapkan algoritma SPADE (lihat juga, Zaki, SPADE: Algoritma Efisien untuk Menambang Urutan yang Sering Digunakan , Pembelajaran Mesin, 42, 31-60, 2001) Saya mengalami masalah memori. Apakah ada cara alternatif yang lebih baik untuk menemukan pola berurutan di antara sekuens kosa kata tinggi yang besar?