Jawaban:
Indeks besar halaman facebook telah dibuat dan tersedia sebagai torrent (Ini ~ 2.8Gb) http://btjunkie.org/torrent/Facebook-directory-personal-details-for-100-million-users/3979e54c73099d291605e7579b90838c2cd86a8e9575
Kumpulan data Twitter ditandai pada Infochimps: http://infochimps.com/tags/twitter
Dataset lastfm tersedia di http://mtg.upf.edu/node/1671
Baru menemukan ini: 476 juta tweet Twitter (via @yarapavan )
Kami telah membuat dataset Twitter untuk teman pengguna pada tahun 2009 dan kemudian pada tahun 2009. Anda dapat menemukan informasi lebih lanjut di sini: http://strict.dista.uninsubria.it/?p=364
Grafik sosial Facebook, instalasi aplikasi dan pengguna Last.fm, acara, grup di http://odysseas.calit2.uci.edu/research/
Dua kumpulan data (dikumpulkan April-Mei 2009) yang berisi sampel representatif dari ~ 1 juta pengguna di seluruh Facebook, dengan beberapa properti beranotasi: untuk setiap pengguna sampel, daftar teman, pengaturan privasi, dan keanggotaan jaringan disertakan. Dataset ketiga (dikumpulkan Februari 2008) mencakup grafik bipartit yang mewakili instalasi aplikasi oleh pengguna Facebook. Dataset keempat dengan Pengguna Aktif Harian dan instalasi aplikasi selama 6 bulan (dikumpulkan September 2007-Februari 2008). Dataset kelima yang mencakup sampel representatif dari pengguna Last.fm yang diperoleh menggunakan pengambilan sampel multigraf (dikumpulkan Juli 2010).
Sumber daya yang baik untuk menemukan kumpulan data adalah:
/ r / dataset di Reddit.
Sekilas pada halaman itu mengungkapkan sumber ini , yang mungkin mengandung sesuatu yang berguna untuk Anda.
Makalah ini menggunakan dataset Facebook yang tersedia di sini. Berikut ini deskripsi dari penulis:
Data mencakup set lengkap simpul dan tautan (dan beberapa informasi demografis) dari 100 perguruan tinggi dan universitas AS dari snapshot tunggal pada September 2005.