Saya memiliki satu set data besar dan persamaan cosinus di antara mereka. Saya ingin mengelompokkannya menggunakan cosine similarity yang menyatukan objek-objek serupa tanpa perlu menentukan sebelumnya jumlah cluster yang saya harapkan.
Saya membaca dokumentasi sklearn DBSCAN dan Affinity Propagation, di mana keduanya membutuhkan matriks jarak (bukan cosine similarity matrix).
Sungguh, saya hanya mencari algoritma yang tidak memerlukan a) metrik jarak dan b) jumlah cluster yang ditentukan sebelumnya .
Adakah yang tahu algoritma yang akan melakukan itu?