Tampaknya masalah yang paling umum dengan "peta aliran" jenis ini adalah ketika banyak garis dimasukkan, mereka bertabrakan sedemikian rupa sehingga menyulitkan untuk membedakan pola yang tidak jelas (ketika aliran timbal balik dianggap terjadi pada tingkat yang lebih besar). Juga garis-garis panjang cenderung mendominasi grafik, meskipun sangat mungkin distribusi aliran didominasi oleh ruang pendek (misalnya sejumlah distribusi yang berbeda antar tempat cenderung mirip dengan penerbangan Levy ). Saya kira ini tidak selalu merupakan hal yang buruk (garis panjang mungkin lebih menarik secara intrinsik daripada garis pendek untuk banyak fenomena), tetapi saya tidak berpikir kita ingin kehilangan hutan untuk pepohonan.
Meskipun saya tidak ragu saya telah melewatkan beberapa "solusi" potensial yang telah diusulkan, saya akan mencoba meringkas beberapa cara individu telah mencoba untuk memecahkan masalah dalam pekerjaan yang saya temui.
Mendistorsi Garis
Jika Anda membaca beberapa utas lainnya saat melihatnya, Anda akan melihat beberapa contoh tentang bagaimana orang-orang mengatasi masalah ini. Secara khusus, garis terdistorsi sehingga tidak saling tumpang tindih atau objek lain di peta. Whuber ini jawaban atas pertanyaan lain yang sejenis (sudah disebutkan dalam komentar) adalah contoh dari ini. Sebuah presentasi oleh beberapa peneliti di Stanford menunjukkan ide yang sama ini (Phan et al., 2005). Terima kasih untuk presentasi yang ditujukan ke dslamb untuk jawaban ini di utas lain (dan semua jawaban atas utas itu akan menarik bagi pertanyaan Anda juga). Saya khususnya tertarik bahwa salah satu contoh utama dari ini adalah peta imigrasi lama oleh Minard adalah contoh dari output yang diinginkan (sekitar tahun 1864!).
Mengingat kasus penggunaan khusus Anda (sejumlah kecil node dan garis), ini tampaknya cukup. "Solusi" lain yang saya sajikan lebih dimaksudkan untuk memvisualisasikan data dengan banyak garis dan banyak asal-tujuan (meskipun saya menganggap itu akan menjadi ringkasan yang berguna bagi masyarakat secara umum, jadi saya melanjutkan tanpa peduli).
Menggunakan Alpha Blending, Color, dan Line Width / Height
Peta yang saya cantumkan dalam utas yang sama yang disebutkan sebelumnya, Representasi aliran jaringan adalah contohnya. Teman-teman facebook adalah kasus yang baik untuk menyesuaikan tingkat garis alfa, sehingga dibutuhkan lebih banyak aliran untuk mewakili koneksi yang lebih gelap (atau lebih cerah dalam kasus itu) antara kedua tempat. Ini juga menekankan garis yang lebih panjang karena mereka cenderung terjadi lebih jarang. Logika serupa berasal dari peta Value-by-Alpha untuk area poligon (Roth et al., 2010) yang telah disebutkan di forum ini sebelumnya .
Peta lain yang saya sajikan dalam jawaban yang sama menggunakan warna, dan garis lengkung perspektif non-tradisional (Ratti et al., 2010). Para penulis menggunakan kriteria pengelompokan untuk mengelompokkan area-area homogen bersama-sama dan kode warna mereka (jadi menurut definisi area dalam warna memiliki pola aliran yang lebih mirip daripada antara warna). Kriteria pengelompokan dalam dan dari dirinya sendiri bisa menarik untuk mengidentifikasi pola dalam data, meskipun tampaknya masalah dengan ini, seperti Andrew Gelman telah disebutkan , adalah bahwa ia memberi tahu Anda apa yang sudah Anda ketahui, yang menempatkan lebih dekat satu sama lain cenderung memiliki lebih banyak koneksi.
Terakhir, dalam kategori ini saya menyertakan teknik yang menimbang garis (mirip dengan alpha blending) menggunakan lebar garis, atau dalam hal ketinggian garis perspektif 3d, untuk menyampaikan volume aliran. Lihat halaman pada halaman perangkat lunak pemetaan aliran Tobler untuk beberapa contoh dalam 2d (dan artikel lain yang saya sebutkan adalah contoh dalam 3d menggunakan ketinggian baris). Juga pada halaman itu Tobler memiliki artikel yang sangat berguna yang menggambarkan masalah dengan flowmap dan aplikasi historisnya (Tobler, 1987).
Contoh lain dalam 3d adalah jawaban ini oleh mankoff di situs ini. Posting ini di blog gambar Sosiologis menunjukkan cara yang berguna dalam diagram alir untuk membedakan antara arus masuk dan keluar (meskipun lagi itu berfungsi karena jumlah node dan relatif kecil, dan node pada jaringan dapat ditata dalam cara sewenang-wenang untuk mengurangi overplotting). Jenis panah yang sama (dan beberapa lainnya menggunakan hashing) juga ada di (Tobler, 1987).
Pada akhirnya, meskipun garis lebar dan warna tidak benar-benar menyelesaikan masalah over-plot. Busur di 3d agak membantu, meskipun dengan pola aliran yang lebih rumit saya pikir mereka akan memiliki utilitas terbatas. IMO alpha blending tampaknya menjadi yang paling berguna dalam berbagai situasi dari ketiganya, tetapi warna dan lebar garis dapat / harus digunakan bersamaan dengan distorsi garis yang disebutkan di atas.
Pengurangan Data
Saya mengelompokkan dua jenis teknik di sini, 1) menggunakan beberapa peta kecil (yaitu banyak peta dengan objek yang lebih sedikit untuk divisualisasikan sehingga overplotting dikurangi), atau 2) representasi grafis lainnya, yang bukan garis, tetapi mewakili beberapa aliran melalui kerapatan atau peta choropleth. Contoh-contoh ini dapat ditemukan di (Corcoran et al., 2009; Rae, 2009; Wood et al., 2010) (terima kasih kepada iant untuk referensi Rae). Ini cenderung mengurangi jumlah informasi visual yang disajikan dengan menghadirkan serangkaian peta berganda kecil (atau hanya area yang lebih kecil), atau menggunakan skema pemetaan choropleth untuk mewakili beberapa statistik (contohnya bisa berupa arus masuk, jumlah arus keluar , arah arus, jarak rata-rata arus). Jika Anda memiliki data level poin, Anda bisa mewakili statistik ini melalui peta raster kepadatan kernal, atau menggabungkannya menjadi kuadrat.
Ketika informasi dikurangi seperti ini, overplotting tidak terlalu menjadi masalah. Contoh online interaktif yang sangat keren adalah peta migrasi ini oleh majalah Forbes . Anda hanya dapat melihat satu county pada satu waktu, tetapi pengurangan informasi membuatnya lebih mudah untuk mengurai garis (dan perbedaan antara aliran masuk dan keluar). Sebuah posting baru-baru ini di blog pemetaan ESRI juga menggunakan teknik yang mirip dengan kelipatan kecil (mereka juga memilih proyeksi tertentu untuk peta dunia untuk memiliki garis "cantik", dan memanfaatkan warna dengan baik untuk lebih menyoroti asal-usul internasional yang berbeda). Dalam contoh itu, ia bekerja dengan cukup baik karena tujuan akhirnya sama untuk semua aliran, tetapi jika aliran bisa bersifat timbal balik, mungkin tidak akan berhasil juga.
Menggunakan Representasi Arus Non-Peta Lainnya
Orang lain di situs ini telah menyarankan menggunakan diagram alternatif untuk peta aktual untuk mewakili aliran (hanya memetakan asal dan tujuan dengan cara lain selain lokasi geografis mereka yang sebenarnya). Contohnya adalah visualisasi khusus (seperti yang diproduksi oleh Circos ), diagram busur (lihat contoh ini pada Protovis, ini juga disebut kriskograms (Xiao & Chun, 2009)), atau matriks peta panas (di sini adalah contoh lain dari Situs web Protovis). Pilihan lain adalah menggunakan beberapa jenis tata letak jaringan otomatis untuk mengidentifikasi pola dalam arus (seperti yang mampu oleh Graphviz ). Selain Graphviz tampaknya Gephi, pustaka NetworkX python, dan beberapa pustaka R juga merupakan alat yang populer (lihatjawaban ini di situs statistik).
Perpustakaan yang saya kutip sangat keren karena mereka telah mengembangkan visualisasi interaktif juga. Berikut adalah contoh dengan gaya yang mirip dengan grafis lingkaran (meskipun tidak melingkar!). Berikut ini visualisasi interaktif lain menggunakan beberapa teknik distorsi garis yang dibahas sebelumnya, penempatan jaringan (yang tampak mirip dengan kartogram Dorling sirkuler) serta ringkasan statistik berguna lainnya (saya melihat kedua contoh tersebut awalnya di blog informasi estetika ).
Beberapa sumber lain yang saya pikir berguna adalah perangkat lunak dan artikel yang berasal dari Spatial Data Mining dan Visual Analytics Lab . Juga pemodelan permintaan perjalanan kriminal dalam program CrimeStat adalah pengantar lembut untuk teknik regresi yang berlaku untuk aliran data tersebut. Salah satu dari alat ini memungkinkan Anda untuk mengidentifikasi korelasi menarik dalam pola aliran ke informasi geografis lainnya. Tempat lain untuk menerima inspirasi yang berguna untuk menampilkan data secara statistik atau analisis statistik akan menjadi isu terbaru dalam Journal of Computational and Graphical Statistics, Volume 20 Edisi 2, saat memeriksa statistik kedatangan / keberangkatan penerbangan untuk maskapai komersial di AS dari tahun 1987 hingga 2008 (jika Anda tertarik untuk menangani data besar, ini akan bermanfaat untuk diperiksa juga). Semua artikel gratis dan mereka memiliki poster terkait dengan setiap makalah.
Pada akhirnya, data dan media akan menentukan seberapa baik beberapa teknik ini bekerja dalam mengurangi kekacauan visual yang datang bersama dengan aliran data. Saya harap ini adalah tempat yang berguna untuk menemukan ide bagaimana menangani masalah visualisasi ini. Jika Anda lebih mempersempit pertanyaan Anda menjadi apa yang ingin Anda capai, maka orang lain dapat memberikan umpan balik yang bermanfaat ke dalam implementasi program aktual (jika ada sesuatu yang belum tersedia).
Kutipan
- Corcoran, Jonathan, Prem Chhetri & Robert Stimson. (2009) Menggunakan statistik sirkuler untuk mengeksplorasi geografi perjalanan menuju tempat kerja. Makalah dalam Ilmu Regional 88 (1): 119-132.
- Phan, Doantam, Ling Xiao, Ron Yeh, Pat Hanrahan & Terry Winograd. (2005) Tata Letak Peta Alur. Dalam Visualisasi Informasi, 2005. INFOVIS 2005. Simposium IEEE : 219–224. | PDF di sini
- Rae, Alasdair. (2009) Dari data interaksi spasial ke informasi interaksi spasial? Geovisualisasi dan struktur spasial migrasi dari sensus UK 2001. Komputer, Lingkungan, dan Sistem Perkotaan 33 (3): 161-178. | PDF di sini
- Ratti, Carlo, Stanislav Sobolevsky, Francesco Calabrese, Clio Andris, Jonathan Reades, Mauro Martino, Rob Claxton & Steven H. Strogatz. (2010) Menggambar kembali peta Britania Raya dari Jaringan Interaksi Manusia. PLoS ONE 5 (12). Artikel adalah akses terbuka dari tautan
- Roth Robert E., Andrew W. Wooddruff & Zachary F. Johnson. (2010) Value-by-alpha maps: Teknik alternatif untuk kartogram. The Cartographic Journal 47 (2): 130-140. | PDF di sini
- Tobler, Waldo R. (1987) Eksperimen dalam pemetaan migrasi dengan komputer. Kartografi dan Ilmu Informasi Geografis 14 (2): 155-163 | PDF di sini
- Wood, Jo, Jason Dykes & Aidan Slingsby. (2010). Visualisasi asal, tujuan dan aliran dengan peta OD. The Cartographic Journal 47 (2): 117-129. | PDF di sini
- Xiao, Ninchuan & Yongwan Chun. (2009) Memvisualisasikan aliran migrasi menggunakan kriskograms. Kartografi dan Ilmu Informasi Geografis 36 (2): 183-191.
* catatan, tautan ke dokumen pdf ungated disertakan ketika saya bisa menemukannya