Saya mengajukan pertanyaan serupa tentang jarak antara "dokumen" (artikel Wikipedia, berita, dll.). Saya membuat pertanyaan ini terpisah karena permintaan pencarian jauh lebih kecil dari dokumen dan jauh lebih ribut. Karenanya saya tidak tahu (dan ragu) apakah metrik jarak yang sama akan digunakan di sini.
Metrik jarak vanila leksikal atau metrik jarak semantik canggih lebih disukai, dengan preferensi yang lebih kuat untuk yang terakhir.