K-means clustering adalah tanpa pengawasan, dan teknik tanpa pengawasan terdekat yang menggunakan EM adalah model-based clustering (Gaussian campuran model, GMM). Masalah yang mengganggu dengan pengelompokan berbasis model GMM terjadi ketika banyak fitur berkorelasi, yang menyebabkan singularitas hampir sama dalam matriks kovarians (korelasi) berbasis fitur. Dalam situasi ini, fungsi kemungkinan menjadi tidak stabil, dengan indeks kondisi mencapai tak terbatas, menyebabkan GMM rusak sepenuhnya.
Jadi, hilangkan ide EM dan kNN - karena didasarkan pada matriks kovarians (korelasi) untuk analisis tanpa pengawasan. Pertanyaan Anda tentang pengoptimalan sangat mirip dengan pemetaan Sammon, dan penskalaan multidimensi metrik dan non-metrik klasik. Pemetaan Sammon berbasis derivatif-iteratif, sementara berbagai bentuk MDS umumnya merupakan komposisi eigend iteratif atau satu langkah, yang tetap dapat dioptimalkan selama operasi matriks satu langkah.
Melihat kembali permintaan Anda: jawabannya adalah: sudah dilakukan dalam pemetaan Sammon.