Di bidang saya, cara yang biasa untuk memplot data berpasangan adalah sebagai serangkaian segmen garis miring tipis, menimpanya dengan median dan CI median untuk dua kelompok:
Namun, plot semacam ini menjadi lebih sulit dibaca karena jumlah titik data menjadi sangat besar (dalam kasus saya yang saya miliki di urutan 10.000 pasang):
Mengurangi alpha sedikit membantu, tapi itu masih tidak bagus. Saat mencari solusi saya menemukan makalah ini , dan memutuskan untuk mencoba menerapkan 'plot garis paralel'. Sekali lagi, ini bekerja sangat baik untuk sejumlah kecil titik data:
Tetapi bahkan lebih sulit untuk membuat plot seperti ini terlihat bagus ketika sangat besar:
Saya kira saya dapat secara terpisah menunjukkan distribusi untuk dua kelompok, misalnya dengan plot kotak atau biola, dan plot garis dengan errorbar di atas menunjukkan dua median / CI, tapi saya benar-benar tidak suka ide itu, karena tidak akan menyampaikan sifat data yang dipasangkan.
Saya juga tidak terlalu tertarik pada ide plot sebar 2D: Saya lebih suka representasi yang lebih kompak, dan idealnya satu di mana nilai-nilai untuk dua kelompok diplot sepanjang sumbu yang sama. Demi kelengkapan, berikut adalah data yang tampak seperti pencar 2D:
Adakah yang tahu cara yang lebih baik untuk merepresentasikan data berpasangan dengan ukuran sampel yang sangat besar? Bisakah Anda menautkan saya ke beberapa contoh?
Edit
Maaf, saya jelas belum melakukan pekerjaan yang cukup baik dalam menjelaskan apa yang saya cari. Ya, plot pencar 2D berfungsi, dan ada banyak cara untuk meningkatkan kerapatan poin - saya bisa mewarnai kode titik-titik menurut perkiraan kepadatan kernel, saya bisa membuat histogram 2D , Saya dapat memplot kontur di atas titik-titik dll, dll.
Namun, saya pikir ini berlebihan untuk pesan yang saya coba sampaikan. Saya tidak benar-benar peduli untuk menunjukkan kerapatan 2D titik per se - yang perlu saya lakukan adalah menunjukkan bahwa nilai untuk 'bar' umumnya lebih besar daripada 'titik', dalam cara yang sesederhana dan sejelas mungkin. , dan tanpa kehilangan sifat penting pasangan data. Idealnya saya ingin memplot nilai-nilai berpasangan untuk dua kelompok di sepanjang sumbu yang sama daripada ortogonal, karena ini membuatnya lebih mudah untuk membandingkannya secara visual.
Mungkin tidak ada pilihan yang lebih baik daripada sebaran plot, tetapi saya ingin tahu apakah ada alternatif yang mungkin berhasil.
bar
pada horizontal dandot
pada sumbu vertikal sebagai sebaran?