Mari kita memiliki matriks simetris kuadrat dari jarak euclide kuadrat antara titik dan vektor memanjang menunjukkan keanggotaan kelompok atau klaster ( k cluster) dari titik-titik tersebut; sebuah cluster dapat terdiri dari \ ge1 point.
Apa cara yang paling efisien atau sangat efisien (dalam hal kecepatan) untuk menghitung jarak antara cluster centroid di sini?
Sejauh ini saya selalu melakukan analisis Koordinator Kepala Sekolah dalam situasi ini. PCoA, atau MDS Torgerson merupakan jumlah pertama yang mengkonversi ke dalam matriks produk skalar ("pemusatan ganda") dan kemudian melakukan PCA untuknya. Dengan cara ini kita membuat koordinat untuk poin dalam ruang euclidean yang direntangkan. Setelah itu, mudah untuk menghitung jarak antara centroid dengan cara biasa - seperti yang Anda lakukan dengan grouped points x variables
data. PCoA hubungannya eigen-dekomposisi atau SVD dari n x n
simetris positif semidefinite , tapi bisa sangat besar. Selain itu, tugasnya bukan pengurangan dimensi dan kita tidak benar-benar membutuhkan sumbu utama ortogonal itu. Jadi saya punya perasaan bahwa dekomposisi ini mungkin berlebihan.
Jadi, apakah Anda memiliki pengetahuan atau ide tentang cara yang berpotensi lebih cepat?