Apa intuisi di balik variasi informasi (VI) metrik untuk validasi cluster?

Untuk non-ahli statistik seperti saya, sangat sulit untuk menangkap ide VImetrik (variasi informasi) bahkan setelah membaca makalah yang relevan oleh Marina Melia " Membandingkan pengelompokan - Jarak berbasis informasi " (Journal of Multivariate Analysis, 2007). Bahkan, saya tidak akrab dengan banyak istilah pengelompokan di luar sana.

Di bawah ini adalah MWE dan saya ingin tahu apa arti output dalam berbagai metrik yang digunakan. Saya memiliki dua kelompok ini dalam R dan dalam urutan id yang sama:

> dput(a)
structure(c(4L, 3L, 4L, 4L, 4L, 4L, 4L, 3L, 4L, 4L, 3L, 3L, 3L, 
4L, 4L, 4L, 4L, 4L, 3L, 4L, 4L, 4L, 3L, 4L, 4L, 3L, 4L, 4L, 4L, 
1L, 1L, 4L, 4L, 4L, 4L, 4L, 4L, 3L, 4L, 4L, 3L, 4L, 4L, 2L, 2L, 
4L, 3L, 3L, 2L, 2L, 2L, 4L, 3L, 4L, 4L, 3L, 1L, 4L, 3L, 4L, 4L, 
4L, 3L, 4L, 4L, 4L, 4L, 2L, 2L, 2L, 4L, 3L, 4L, 4L, 4L, 4L, 4L, 
4L, 4L, 4L, 4L, 3L, 4L, 4L, 3L, 4L, 4L, 4L, 4L, 4L, 4L, 3L, 4L, 
4L, 3L, 4L, 4L, 4L, 4L, 4L, 4L, 3L, 4L, 4L, 4L, 4L, 2L, 2L, 4L
), .Label = c("1", "2", "3", "4"), class = "factor")
> dput(b)
structure(c(4L, 3L, 4L, 4L, 4L, 4L, 4L, 3L, 4L, 4L, 3L, 3L, 3L, 
4L, 4L, 3L, 4L, 4L, 3L, 4L, 4L, 4L, 3L, 4L, 4L, 3L, 4L, 4L, 4L, 
1L, 1L, 4L, 4L, 4L, 4L, 4L, 4L, 3L, 4L, 4L, 3L, 4L, 4L, 2L, 2L, 
4L, 3L, 3L, 2L, 2L, 2L, 4L, 3L, 4L, 4L, 3L, 1L, 4L, 3L, 4L, 4L, 
3L, 3L, 4L, 4L, 4L, 4L, 2L, 2L, 2L, 4L, 3L, 3L, 4L, 4L, 4L, 4L, 
4L, 4L, 4L, 4L, 3L, 4L, 4L, 3L, 4L, 4L, 4L, 4L, 4L, 4L, 3L, 4L, 
4L, 3L, 4L, 4L, 4L, 4L, 4L, 3L, 3L, 4L, 4L, 4L, 4L, 2L, 2L, 4L
), .Label = c("1", "2", "3", "4"), class = "factor")

Sekarang melakukan perbandingan berdasarkan VIserta metrik / indeks lainnya dan dalam urutan kronologis penampilan mereka dalam literatur.

library(igraph)
  # Normalized Mutual Information (NMI) measure 2005:
compare(a, b, method = c("nmi")) 
[1] 0.8673525
  # Variation of Information (VI) metric 2003:
compare(a, b, method = c("vi")) 
[1] 0.2451685
  # Jaccard Index 2002:
clusteval::cluster_similarity(a, b, similarity = c("jaccard"), method = "independence") 
[1] 0.8800522
  # van Dongen S metric 2000:
compare(a, b, method = c("split.join")) 
[1] 8
  # Adjusted Rand Index 1985:
compare(a, b, method = c("adjusted.rand")) 
[1] 0.8750403
  # Rand Index 1971:
compare(a, b, method = c("rand")) 
[1] 0.9374788

Seperti yang Anda lihat, VInilainya berbeda dari yang lainnya.

Apa yang dikatakan nilai ini (dan bagaimana hubungannya dengan gambar di bawah)?
Apa pedoman untuk mempertimbangkan nilai ini rendah atau tinggi?
Apakah ada pedoman yang ditetapkan?

Mungkin para ahli di bidang ini dapat memberikan beberapa deskripsi yang masuk akal untuk orang awam seperti saya ketika mencoba melaporkan hasil seperti itu. Saya akan sangat menghargai jika seseorang juga memberikan pedoman untuk metrik lain (kapan harus mempertimbangkan nilainya besar atau kecil, yaitu, dalam kaitannya dengan kesamaan antara dua kluster).

Saya telah membaca utas terkait di sini dan di sini , tetapi masih tidak dapat memahami intuisi di belakang VI. Adakah yang bisa menjelaskan hal ini dalam bahasa Inggris?

Gambar di bawah ini adalah gambar 2 dari makalah yang disebutkan di atas VI.

masukkan deskripsi gambar di sini

r clustering validation intuition

— gelar doktor
sumber

Semua kesamaan dan metrik ini (perhatikan perbedaan antara kedua jenis) mengukur dalam beberapa cara jumlah fragmentasi yang terkait dengan subkluster umum terbesar antara kedua partisi. Mereka semua menggunakan apa yang dikenal sebagai matriks kebingungan. Dengan mempertimbangkan formula yang tepat untuk VI dapat dipahami untuk mengukur fragmentasi itu. Saya akan menyarankan melihat rumus di salah satu publikasi Meila, dan juga untuk membaca tentang versi normal dari semua jarak ini, karena mereka semua memiliki skala yang berbeda. Ini mungkin poin terpenting.

— micans

Saya juga berjuang dengan interpretasi VI dan menemukan artikel ini sangat berguna!

— Pizza

Anda perlu menyadari bahwa tindakan mungkin memiliki interpretasi yang berbeda.

Menilai dari plot Anda, VI rendah baik.

1 - 0.2451685 = 0.7548315

yang jauh lebih sejalan dengan langkah-langkah lainnya.

Namun, perhatikan bahwa sebagian besar tindakan ini mengukur sesuatu yang berbeda .

Tidak ada alasan untuk berasumsi bahwa hanya karena satu ukuran 0,8, yang lain juga harus 0,8

— Memiliki QUIT - Anony-Mousse
sumber

Saya pikir OP akan menghargainya jika Anda bisa menjelaskan apa bedanya ukuran masing-masing.

— gung - Reinstate Monica

Saya tidak cukup mengenal mereka untuk menjelaskan masing-masing. Hanya jelas bahwa tidak memiliki skala / unit yang sebanding. Sama seperti Volt dan kaki tidak sebanding.

— Memiliki QUIT - Anony-Mousse