Saya mencoba mengevaluasi kinerja pengelompokan. Saya sedang membaca dokumentasi skiscit-learning tentang metrik . Saya tidak mengerti perbedaan antara ARI dan AMI. Tampak bagi saya bahwa mereka melakukan hal yang sama dalam dua cara berbeda.
Mengutip dari dokumentasi:
Mengingat pengetahuan tentang tugas kelas kebenaran ground label_true dan penugasan algoritma pengelompokan sampel sampel yang sama dengan label_pred, indeks Rand yang disesuaikan adalah fungsi yang mengukur kesamaan dari dua tugas, mengabaikan permutasi dan dengan normalisasi peluang.
vs.
Mengingat pengetahuan penugasan kelas kebenaran tanah label_true dan penugasan algoritma pengelompokan sampel sampel yang sama dengan label_pred, Informasi Mutual adalah fungsi yang mengukur perjanjian dua penugasan, mengabaikan permutasi ... AMI diusulkan baru-baru ini dan dinormalisasi terhadap kesempatan.
Haruskah saya menggunakan keduanya dalam evaluasi pengelompokan saya atau apakah ini berlebihan?