Saya telah bekerja pada metode baru untuk menganalisis dan mengurai dataset untuk mengidentifikasi dan mengisolasi subkelompok populasi tanpa mengetahui karakteristik subkelompok mana pun. Sementara metode ini bekerja cukup baik dengan sampel data buatan (yaitu kumpulan data yang dibuat khusus untuk tujuan mengidentifikasi dan memisahkan subset populasi), saya ingin mencoba mengujinya dengan data langsung.
Apa yang saya cari adalah sumber data yang tersedia secara bebas (yaitu non-rahasia, non-eksklusif). Lebih disukai yang mengandung distribusi bimodal atau multimodal atau jelas terdiri dari beberapa himpunan bagian yang tidak dapat dengan mudah dipisahkan melalui cara tradisional. Ke mana saya akan pergi untuk mencari informasi seperti itu?