Saya setuju bahwa plot "terbaik" tidak ada terlepas dari set data, jumlah pembaca, dan tujuan. Untuk dua variabel terukur, sebar plot bisa dibilang merupakan desain yang membuat semua yang lain di belakangnya, kecuali untuk tujuan tertentu, tetapi tidak ada pemimpin pasar seperti itu jelas untuk data kategorikal.
Tujuan saya di sini adalah hanya untuk menyebutkan metode sederhana, sering ditemukan kembali atau diciptakan kembali, tetapi bagaimanapun juga sering diabaikan bahkan dalam monograf atau buku teks yang mencakup grafik statistik.
Contoh pertama, mencakup data yang sama seperti yang diposting oleh xan:
Jika sebuah nama dicari, seperti biasanya, ini adalah barchart dua hari (dalam hal ini). Saya tidak akan membuat katalog istilah lain di sini, kecuali beberapa barchart adalah salah satu alternatif umum dengan rasa serupa. (Keberatan kecil saya untuk "banyak barchart" adalah bahwa "beberapa" tidak mengesampingkan grafik batang yang sangat umum ditumpuk atau berdampingan, sedangkan "twoway" bagi saya lebih jelas menyiratkan tata letak baris dan kolom, meskipun pada gilirannya mungkin mengambil contoh untuk memperjelasnya.)
Plus dan minus untuk plot semacam ini juga sederhana, tetapi saya akan menjelaskannya. Karena saya menyukai desain ini (yang kembali setidaknya ke tahun 1930-an), orang lain mungkin ingin menambahkan kritik yang lebih tajam.
+1. Idenya mudah dipahami , bahkan oleh kelompok non-teknis. Tinggi batang atau panjang batang mengkodekan frekuensi dalam contoh ini. Dalam contoh lain, mereka dapat menyandikan persentase yang dihitung dengan cara apa pun yang Anda suka, residual, dll.
+2. Struktur baris-dan-kolom cocok dengan tabel . Anda dapat menambahkan nilai numerik juga. Jumlah yang sangat kecil dan bahkan nol tersirat jelas jelas, yang tidak selalu terjadi dengan desain lain (misalnya grafik batang bertumpuk, plot mosaik). Pelabelan baris dan kolom biasanya lebih efisien daripada menambahkan kunci atau legenda, dengan mental "bolak-balik" yang diperlukan. Dengan demikian, desain ini menghibridisasikan ide-ide grafik dan tabel, yang tampaknya mengganggu sebagian pembaca; sebaliknya, saya berpendapat bahwa perbedaan yang kuat antara Gambar dan Tabel hanyalah hang-over historis, usang sekarang bahwa peneliti dapat menyiapkan dokumen mereka sendiri dan tidak harus bergantung pada desainer, kompositor dan printer.
+3. Perluasan pada desain tiga arah dan lebih tinggi pada prinsipnya mudah . Letakkan dua atau lebih variabel sebagai variabel komposit pada salah satu atau kedua sumbu, atau berikan array plot tersebut. Secara alami, semakin rumit desainnya, semakin rumit interpretasinya.
+4. Desainnya jelas memungkinkan variabel ordinal pada kedua sumbu. Urutan dapat diekspresikan (misalnya) dengan naungan yang sesuai serta urutan kategori pada sumbu itu. Urutan kategori pada sumbu dapat ditentukan oleh maknanya, atau lebih baik ditentukan oleh frekuensi; urutan alfabet menurut label teks mungkin merupakan standar, tetapi tidak boleh menjadi satu-satunya pilihan yang dipertimbangkan.
-1. Dengan menjadi umum dalam desain, plot dapat menjadi kurang efisien dalam menunjukkan jenis hubungan tertentu . Secara khusus, plot mosaik dapat membuat keberangkatan dari kemerdekaan menjadi sangat jelas. Sebaliknya, ketika hubungan antara variabel kategori rumit atau tidak jelas, maka biasanya tidak ada grafik yang baik untuk menunjukkan lebih dari fakta yang lemah.
-2. Dalam beberapa hal desainnya tidak efisien dalam penggunaan ruang dengan menyisakan ruang untuk setiap kombinasi silang terlepas dari apakah atau seberapa sering itu terjadi. Ini adalah sifat buruk dari prinsip yang sama yang dianggap sebagai kebajikan. Desain khusus di atas mengkategorikan kategori secara merata terlepas dari frekuensinya; Mengorbankan yang sering mengorbankan label marjinal yang mudah dibaca, yang sangat saya hargai. Dalam contoh ini, label teks kebetulan semuanya sangat pendek, tetapi itu jauh dari tipikal.
Catatan: Data xan tampaknya hanya ditemukan, jadi saya tidak akan mencoba interpretasi seperti yang dicoba pada jawaban lain. Tetapi beberapa kearifan rumahan layak menerima kata terakhir di sini: desain terbaik untuk Anda adalah desain yang paling baik menyampaikan kepada Anda dan pembaca Anda struktur beberapa data nyata yang Anda pedulikan.
Contoh lain termasuk
Bagaimana Anda bisa memvisualisasikan hubungan antara 3 variabel kategori?
Grafik untuk hubungan antara dua variabel ordinal