Misalkan menjadi fungsi yang kita sebut sebagai fungsi kesamaan . Contoh fungsi kesamaan adalah jarak cosinus, norma , jarak Hamming, kesamaan Jaccard, dll.l 2
Pertimbangkan vektor biner dengan panjang : .k → v ∈ ( { 0 , 1 } k ) n
Tujuan kami adalah untuk mengelompokkan vektor yang serupa. Secara lebih formal, kami ingin menghitung grafik kesamaan di mana simpul adalah vektor dan ujungnya mewakili vektor yang serupa ( ).
dan adalah angka yang sangat besar, dan membandingkan dua vektor panjang adalah mahal, kita tidak bisa melakukan semua operasi brute-force . Kami ingin menghitung grafik kesamaan dengan operasi yang jauh lebih sedikit.k O ( n 2 )
Apakah ini mungkin? Jika tidak, bisakah kita menghitung perkiraan grafik yang berisi semua tepi dalam grafik kesamaan ditambah mungkin paling banyak tepi lainnya?