Anda bisa mengubah matriks jarak menjadi data mentah dan memasukkannya ke pengelompokan K-Means. Langkah-langkahnya adalah sebagai berikut:
1) Jarak antara titik N Anda harus kuadratkan dengan euclidean. Melakukan " double centering " dari matriks: Mengurangi mean baris dari setiap elemen; dalam hasilnya, rata-rata kolom pengurangan dari setiap elemen; dalam hasilnya, tambahkan mean matriks ke setiap elemen; bagi dengan minus 2. Matriks yang Anda miliki sekarang adalah matriks SSCP (jumlah-kuadrat-dan-silang) antara titik-titik Anda di mana titik asal diletakkan di pusat geometris awan titik N. (Baca penjelasan tentang pemusatan ganda di sini .)
2) Lakukan PCA (Analisis komponen utama) pada matriks itu dan dapatkan matriks pemuatan komponen NxN . Beberapa kolom terakhir cenderung berjumlah 0, - jadi potong saja. Yang Anda pertahankan sekarang sebenarnya adalah skor komponen utama, koordinat titik N Anda ke komponen utama yang lulus, sebagai sumbu, melalui cloud Anda. Data ini dapat diperlakukan sebagai data mentah yang cocok untuk input K-Means.
PS Jika jarak Anda tidak benar secara geometris kuadrat euclidean Anda mungkin mengalami masalah: matriks SSCP mungkin tidak positif (semi) pasti. Masalah ini dapat diatasi dengan beberapa cara tetapi dengan kehilangan presisi.