Apa arti total ss dan antar ss dalam pengelompokan k-means?


10

Saya sangat baru dalam analisis cluster. Saya menggunakan R untuk k-means clustering dan saya bertanya-tanya apa itu. Dan apa yang lebih baik jika rasio mereka lebih kecil atau lebih besar?

Jawaban:


12

Ini pada dasarnya ukuran kebaikan klasifikasi k-means telah ditemukan. SS jelas merupakan singkatan dari Sum of Squares, jadi itu adalah dekomposisi penyimpangan dalam penyimpangan "Antara" dan penyimpangan "Dalam". Idealnya Anda menginginkan pengelompokan yang memiliki sifat kohesi internal dan pemisahan eksternal, yaitu rasio BSS / TSS harus mendekati 1.

Misalnya, dalam R:

data(iris)
km <- kmeans(iris[,1:4], 3)

memberikan rasio BSS / TSS 88,4% (0,884) yang mengindikasikan kecocokan. Anda harus berhati-hati, dan biasanya ide yang baik untuk merencanakan WSS terhadap jumlah cluster, karena jumlah ini harus ditentukan sebelumnya.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.