R hadir dengan banyak kumpulan data, dan sepertinya itu bukan masalah besar untuk mereproduksi sebagian besar contoh yang Anda kutip dengan beberapa baris kode. Anda juga dapat menemukan paket mlbench berguna, khususnya kumpulan data sintetis yang dimulai dengan mlbench.*
. Beberapa ilustrasi diberikan di bawah ini.
Anda akan menemukan contoh tambahan dengan melihat Tampilan Tugas Cluster di CRAN. Sebagai contoh, paket fpc memiliki generator bawaan untuk dataset benchmark clustered "face-shaped" ( rFace
).
Pertimbangan serupa berlaku untuk Python, di mana Anda akan menemukan tes benchmark yang menarik dan kumpulan data untuk pengelompokan dengan scikit-learn .
Repositori Mesin Pembelajaran UCI juga menyimpan banyak set data , tetapi Anda lebih baik mensimulasikan data sendiri dengan bahasa pilihan Anda.