Baru-baru ini saya memasuki bidang pembelajaran mesin dan proyek yang sedang saya kerjakan mengharuskan saya untuk mengelompokkan pengguna berdasarkan urutan mereka mengunjungi halaman web di situs web. Saya punya data dalam bentuk:
['user_id', 1, 2, 4, 6, 3, 7, 3, 2, 4...]
Di mana setiap angka adalah kategori / halaman yang dikunjungi pengguna. Selain itu, panjang data untuk setiap pengguna tidak sama yaitu beberapa pengguna mengunjungi lebih banyak halaman daripada yang lain.
Saya menyadari ini benar-benar kabur dan mendefinisikan kesamaan itu sulit. Saya mencoba mengikuti contoh dalam makalah penelitian ini dan sejujurnya banyak yang terlintas di kepala saya.
Saya butuh bantuan dalam cara mendekati masalah ini dan terbuka untuk ide dan saran baru.