Ada beberapa dataset klasik untuk tugas klasifikasi / regresi pembelajaran mesin. Yang paling populer adalah:
- Set Data Bunga Iris ;
- Set Data Titanic ;
- Mobil Tren Motor ;
- dll.
Tetapi apakah ada yang tahu dataset serupa untuk analisis jaringan / teori grafik? Lebih konkret - Saya mencari dataset standar Gold untuk membandingkan / mengevaluasi / belajar:
- langkah-langkah sentralitas;
- algoritma pengelompokan jaringan.
Saya tidak memerlukan daftar jaringan / grafik yang tersedia untuk umum, tetapi beberapa set data yang benar-benar harus diketahui.
EDIT:
Cukup sulit untuk menyediakan fitur yang tepat untuk "set data standar emas", tetapi berikut adalah beberapa pemikiran. Saya pikir, dataset klasik nyata harus memenuhi kriteria ini:
- Referensi berganda dalam artikel dan buku teks;
- Inklusi dalam paket perangkat lunak analisis jaringan yang terkenal;
- Waktu keberadaan yang memadai;
- Penggunaan dalam sejumlah kursus tentang analisis grafik.
Mengenai bidang minat saya, saya juga perlu kelas berlabel untuk simpul dan / atau "skor otoritas" yang sudah ditentukan sebelumnya (yaitu perkiraan sentralitas). Setelah mengajukan pertanyaan ini, saya terus mencari, dan berikut adalah beberapa contoh yang cocok:
- Zachary's Karate Club : diperkenalkan pada tahun 1977, dikutip lebih dari 1,5 ribu kali (menurut Google Cendekia), vertex memiliki atribut Faction (yang dapat digunakan untuk pengelompokan).
- Jaringan Kolaborasi Erdos : sayangnya, saya belum menemukan jaringan ini dalam bentuk data-file, tetapi ini agak terkenal, dan jika seseorang akan memperkaya jaringan dengan data spesialisasi matematikawan, itu juga dapat digunakan untuk menguji algoritma pengelompokan.