Saya memiliki beberapa distribusi (10 distribusi pada gambar di bawah).
Sebenarnya ini adalah histogram: ada 70 nilai pada sumbu x yang merupakan ukuran beberapa partikel dalam larutan dan untuk setiap nilai x nilai y yang sesuai adalah proporsi partikel yang ukurannya berada di sekitar nilai x.
Saya ingin mengelompokkan distribusi ini. Saat ini saya menggunakan pengelompokan hierarkis dengan jarak Euclidean misalnya. Saya tidak puas dengan pilihan jarak. Saya telah mencoba informasi-teori jarak seperti Kullback-Leibler tetapi ada banyak nol dalam data dan ini menyebabkan kesulitan. Apakah Anda memiliki proposal dengan jarak yang sesuai dan / atau metode pengelompokan lain?