Saya punya pertanyaan yang sangat mendasar tentang pengelompokan. Setelah saya menemukan k cluster dengan centroid mereka, bagaimana cara menafsirkan kelas poin data yang telah saya klaster (memberikan label kelas yang bermakna untuk masing-masing cluster). Saya tidak berbicara tentang validasi cluster yang ditemukan.
Dapatkah itu dilakukan dengan diberikan satu set kecil titik data berlabel, menghitung ke cluster mana titik-titik berlabel ini milik dan berdasarkan pada jenis dan jumlah titik yang diterima masing-masing cluster, memutuskan labelnya? Tampaknya ini cukup jelas, tetapi saya tidak tahu bagaimana standarnya untuk menetapkan label ke klaster dengan cara ini.
Agar jelas, saya ingin melakukan pengelompokan tanpa pengawasan yang tidak menggunakan label apa pun untuk pertama kali menemukan kluster saya. Kemudian setelah menemukan cluster, saya ingin menetapkan label kelas yang bermakna untuk cluster berdasarkan properti dari beberapa contoh datapoints.