Saya sedang membuat visualisasi data. Setiap datum diwakili oleh kuadrat. Untuk membuat data yang mendasarinya dapat dibaca secara intuitif, haruskah panjang sisi setiap kotak atau luas setiap kotak sebanding dengan datum yang diwakilinya?
Saya sedang membuat visualisasi data. Setiap datum diwakili oleh kuadrat. Untuk membuat data yang mendasarinya dapat dibaca secara intuitif, haruskah panjang sisi setiap kotak atau luas setiap kotak sebanding dengan datum yang diwakilinya?
Jawaban:
Jika Anda, sang pencipta, tidak yakin, bagaimana pembaca akan tahu yang mana?
Jawaban singkat: nilainya harus dikaitkan 1: 1 dengan jumlah warna pada halaman . Jadi, dalam contoh Anda, itu harus area. Tetapi ada lebih dari itu: Anda juga perlu menghindari isyarat menyesatkan yang mungkin membuat pembaca salah membaca, dan Anda perlu tahu mengapa Anda menggunakan area alih-alih panjang (misalnya grafik batang), karena memiliki pro dan kontra yang nyata.
Pertama, tidak pernah memiliki panjang dan lebar (yaitu area) dari perubahan bentuk ketika sebenarnya variabel hanya terkait dengan panjang satu sisi. Jika X ganda Y tetapi Y memiliki empat kali lebih banyak warna pada halaman, Anda menyesatkan pembaca Anda. Distorsi semacam ini kadang-kadang disebut sebagai " faktor kebohongan ", dan sering dianggap sebagai upaya yang disengaja untuk menyesatkan dan melebih-lebihkan perbedaan.
Jika Anda menggunakan area sebagai ukuran saya sangat merekomendasikan:
Mengetahui alasan Anda menggunakan area . Dengan menggunakan area alih-alih dimensi linear seperti panjang, Anda:
Pertimbangkan menggunakan lingkaran untuk area, bukan bujur sangkar, sejajar tengah :
Misalnya, di atas, sulit untuk tidak melihat kuadrat berlabel "5" sebagai tiga perempat tingginya kuadrat berlabel "10", sehingga berpotensi menyesatkan.
Lingkaran tidak mengundang perbandingan semacam ini: ini lebih merupakan level intuisi, instan "Gumpalan itu jauh lebih besar daripada gumpalan berikutnya".
Ada berbagai bukti dari pengujian pengguna hingga studi skala kecil (akan mencoba memburu beberapa contoh nanti) bahwa perbandingan berbasis area intuitif ini bisa lebih menarik, dapat menurunkan penghalang untuk masuk ke audiens yang kurang terlibat, dan dapat membantu menjaga fokus pembaca pada pokok bahasan daripada hal-hal kecil yang dingin dari angka-angka. Tetapi ini datang dengan biaya menghalangi analisis yang lebih numerik.
Jangan memilih antara satu dimensi (panjang atau jarak) dan dua dimensi (area) karena alasan estetika: pilih di antara mereka berdasarkan audiens dan pesan Anda.
Mana yang lebih tepat untuk komunikasi: perbandingan tingkat usus instan pada tingkat "itu jauh lebih besar", atau lebih perbandingan numerik dianggap pada tingkat "itu sekitar 80% dari yang lain"?
Atau adakah alasan praktis mengapa Anda perlu menggunakan area?
Kemudian, ketika Anda memilih untuk alasan praktis , terapkan estetika.
Saya akan mengatakan daerah. Secara optis, sebuah bujur sangkar dengan sisi dua kali lebih panjang menunjukkan luas 4 kali lebih besar. Pengamat kasual akan berhubungan dengan daerah tersebut, bahkan tanpa membaca legenda Anda.
Contoh yang bagus adalah grafik legendaris ini dari xkcd 's Randall Munroe:
Kami tidak pandai menilai perbedaan dalam bidang seperti panjangnya kami. Kami menggunakan panjang sebagai proksi dan karenanya cenderung meremehkan perbedaan dalam area.
Karena alasan ini, sebuah lingkaran yang sebenarnya memiliki 2x luas bidang lain tampak terlalu kecil karena otak kita menghubungkan jari-jarinya, yang berbeda dengan faktor 1,4x.
Ada upaya menarik untuk merekonsiliasi fenomena ini, seperti Pemetaan Simbol Proportional dalam R , yang mengusulkan penskalaan simbol perseptual agar lebih selaras dengan bagaimana kita menilai panjang dan area.
Berikut adalah Gambar. 2 dari makalah ini
Secara pribadi saya tidak punya pengalaman dengan ini dan menghindari menggunakan area jika penilaian kuantitatif diperlukan.
Garis singgung yang menarik adalah hubungan antara persepsi volume dan panjang. Perbedaan dalam cara kita memandang ini bahkan lebih mencolok. Ini dapat diilustrasikan dalam video perbandingan ukuran bintang ini .
Pada saat Anda mencapai bintang terbesar, yaitu sekitar 1.700x diameter matahari, Anda memiliki kesan bahwa ukurannya jauh lebih besar dari 1.700x.
Untuk melihat lebih sistematis tentang kesalahan kami dalam memahami perbedaan dalam area dan panjang, lihat Crowdsourcing Graphical Perception: Menggunakan Mechanical Turk untuk Menilai Desain Visualisasi oleh Jeffrey Heer dan Michael Bostock.
Menurut saya area (D), tidak setiap sisi (E).
Jika Anda menggunakan sisi panjang 2, maka area akan menjadi 4 kali nilainya dan Anda akan memiliki grafik yang sangat tumpang tindih. (E)
Ketika Anda memiliki grafik batang normal (A), datanya linear, dan dengan bilah hanya untuk estetika. (B)
Dalam kasus tersebut, area tersebut kembali mewakili data karena dengan bilah sama. Anda dapat memiliki bilah 3D dan volume bilah tetap mewakili data (C)
Tufte berurusan dengan ini secara ekstensif. Lihat:
Beberapa prinsip integritas grafis:
- Representasi angka, seperti yang diukur secara fisik pada permukaan grafik itu sendiri, harus berbanding lurus dengan jumlah numerik yang diwakili
- Pelabelan yang jelas, terperinci dan menyeluruh harus digunakan untuk mengalahkan distorsi grafis dan ambiguitas. Tuliskan penjelasan data pada grafik itu sendiri. Beri label peristiwa penting dalam data.
- Tampilkan variasi data, bukan variasi desain.
- Dalam tampilan time-series of money, unit pengukuran moneter yang deflated dan terstandarisasi hampir selalu lebih baik daripada unit nominal.
- Jumlah dimensi pembawa informasi (variabel) yang digambarkan tidak boleh melebihi jumlah dimensi dalam data. Grafik tidak boleh mengutip data di luar konteks.
Dalam kasus Anda, Anda harus bertanya pada diri sendiri apakah data lebih baik diwakili oleh gambar 2D atau 3D atau garis. Sebuah kubus, kotak, dan garis tidak sama. Itulah salah satu alasan mengapa grafik batang 3D begitu sering menyesatkan.