Salah satu caranya adalah dengan memeriksa secara manual anggota dalam kelompok Anda untuk k tertentu untuk melihat apakah pengelompokan masuk akal (apakah mereka dapat dibedakan?). Ini dapat dilakukan melalui tabel kontingensi dan cara bersyarat. Lakukan ini untuk berbagai k dan Anda dapat menentukan nilai apa yang sesuai.
Cara yang kurang subyektif adalah dengan menggunakan Nilai Siluet:
/programming/18285434/how-do-i-choose-k-when-using-k-means-clustering-with-silhouette-function
Ini dapat dihitung dengan paket perangkat lunak favorit Anda. Dari tautan:
Metode ini hanya membandingkan kesamaan intra-grup dengan kesamaan kelompok terdekat. Jika ada jarak rata-rata anggota data ke anggota lain dari kluster yang sama lebih tinggi dari jarak rata-rata ke beberapa anggota kluster lain, maka nilai ini negatif dan pengelompokan tidak berhasil. Di sisi lain, nilai silhuette mendekati 1 menunjukkan operasi pengelompokan yang sukses. 0,5 bukan ukuran yang tepat untuk pengelompokan.