Pada dasarnya, tujuan pengelompokan grafik dan metode deteksi komunitas adalah untuk menghitung cluster. Apakah ada perbedaan di antara mereka?
Pada dasarnya, tujuan pengelompokan grafik dan metode deteksi komunitas adalah untuk menghitung cluster. Apakah ada perbedaan di antara mereka?
Jawaban:
Tidak. Misalnya mengutip dari deteksi Komunitas dalam grafik , survei terbaru dan sangat baik oleh Santo Fortunato, "Fitur jaringan nyata ini disebut struktur komunitas (Girvan dan Newman, 2002), atau pengelompokan". Tidak ada gunanya menjelaskan lebih lanjut tentang hal ini. Saya merasa bahwa dalam makalah gaya analisis jejaring sosial awal jaringan cenderung sederhana (tidak berbobot), tetapi itu bukan sesuatu yang ingin saya perdebatkan, juga tidak penting. Jawaban untuk pertanyaan Anda adalah tidak.
Dalam Mendeteksi Struktur Komunitas dalam Jaringan , M.Newman mendefinisikan pengelompokan grafik sebagai masalah khusus yang didefinisikan dalam konteks ilmu komputer.
Mari kita pertimbangkan beberapa perhitungan, yang dapat dibagi dalam beberapa operasi sederhana. Ini direpresentasikan sebagai simpul di jaringan kami. Tautan terkait dengan dependensi antara operasi, yaitu hasil dari satu operasi diperlukan oleh yang lain. Masalahnya terdiri dari mendistribusikan operasi melalui beberapa prosesor, untuk keperluan pemrosesan paralel. Dengan kata lain, kami ingin menetapkan setiap node (operasi) ke kelas tertentu (prosesor), yaitu kami ingin mempartisi grafik.
Namun ada tiga kendala. Yang pertama adalah untuk mendapatkan jumlah komunitas yang telah ditentukan, karena jumlah prosesor jelas diketahui sebelumnya. Yang kedua adalah untuk mendapatkan beban yang seimbang: kami ingin setiap prosesor melakukan kira-kira jumlah operasi yang sama. Dalam hal grafik, kami ingin komunitas memuat kira-kira jumlah node yang sama. Yang ketiga adalah untuk mendapatkan komunikasi serendah mungkin antara prosesor, karena memperlambat proses. Jadi, dalam hal grafik, kami ingin meminimalkan jumlah tautan antar komunitas.
Jadi, dari sudut pandang ini, deteksi komunitas dapat dianggap sebagai masalah yang lebih umum daripada pengelompokan grafik. Kendala ketiga ditegakkan dalam kedua masalah tersebut, tetapi jumlah dan ukuran komunitas tidak diketahui secara apriori dalam deteksi komunitas.
Dua nama yang berbeda ini diberikan untuk hal yang sama oleh komunitas ilmuwan yang berbeda, tergantung pada apakah seseorang ingin menekankan motivasi jejaring sosial atau tidak. Mungkin seseorang mendefinisikan pengelompokan dan deteksi komunitas sebagai hal yang berbeda, tetapi sebagian besar orang yang mempelajari salah satu dari mereka tidak akan dapat memberi tahu Anda mengapa mereka tidak menggunakan istilah yang lain.
Jika jaringan besar dikelompokkan menjadi dua bagian, apa yang menjamin Anda bahwa dua bagian ini adalah dua komunitas? Dua cluster memiliki koneksi yang rendah tidak berarti bahwa setiap cluster memiliki jenis node yang sama atau node memiliki jenis koneksi yang sama (oleh karena itu komunitas). Pikirkan grafik jaringan sosial. Pasti ada banyak komunitas. Juga dengan mengelompokkan algoritma, Anda dapat mengelompokkannya menjadi dua bagian. Dalam hal ini, apakah Anda menyebut setiap bagian komunitas. ? Jawaban saya adalah tidak. Sebab, kedua cluster tersebut mungkin orang-orang dari dua wilayah geografis. Dan tentu saja itu bukan komunitas.
Algoritme pengelompokan hanya memperhatikan pemotongan minimum, bukan tentang kesamaan simpul atau kesamaan koneksi atau koneksi padat. Ditambah dalam algoritma pengelompokan, jumlah cluster harus ditentukan sebelumnya.
Algoritma pendeteksian komunitas, mereka peduli dengan kepadatan, mereka menemukan bagian yang lebih padat dari jaringan dan algoritma semacam itu (saya telah melihat sejauh ini) tidak perlu menentukan jumlah komunitas.
Namun, algoritma pengelompokan dapat digunakan untuk menemukan komunitas, maka, karena tidak menjamin bahwa setiap cluster memiliki struktur komunitas yang baik, setiap cluster harus diperiksa dengan cermat.
"Orang tidak bisa secara sepele menerapkan penemuan komunitas untuk menyelesaikan pengelompokan dan sebaliknya. terlepas dari kesamaan mereka, ada perbedaan penting dalam pendekatan. Penemuan komunitas mengasumsikan koneksi jarang, sementara pengelompokan dapat bekerja dengan kumpulan data yang padat; dalam pengelompokan kita biasanya berurusan dengan atribut dengan banyak tipe , sementara penemuan komunitas biasanya berkaitan dengan satu tipe atribut - edge - sering biner, dalam kasus jaringan tidak tertimbang "untuk informasi lebih lanjut bacalah makalah berikut:" Tentang Kesetaraan Antara Penemuan Komunitas dan Clustering "oleh Riccardo Guidotti dan Michele Coscia