Ada beberapa manfaat dan kelemahan dari setiap cara melakukannya. Untuk membuat cerita panjang pendek, saya akan merekomendasikan membuat "tempat sampah." Beberapa catatan untuk membantu Anda memilih, dan tentang merancang choropleth secara umum:
Pemetaan langsung dari nilai data ke warna (peta 'tidak berbaris') dapat dianggap sebagai cara paling akurat untuk menampilkan data, namun peta yang diklasifikasi (peta dengan 'tempat sampah') dapat lebih terbaca karena beberapa alasan.
Jika Anda menggunakan peta yang tidak diklasifikasi dan datanya miring, atau ada outlier dalam kumpulan data, outlier akan menonjol dengan jelas, sementara banyak poligon dapat berakhir dengan warna yang sangat mirip. Ini akan menyoroti fakta bahwa beberapa area secara radikal berbeda dari yang lain (dalam kasus Anda, jika beberapa area memiliki preferensi yang jauh lebih besar untuk satu kandidat daripada yang lain), tetapi lebih sulit untuk membedakan hubungan dalam sisa area peta.
Dalam peta yang dikelompokkan, masing-masing kelas harus berbeda secara visual, sehingga mudah untuk mengetahui di mana suatu daerah terletak pada data, dengan mengorbankan beberapa perbedaan yang lebih baik yang hilang.
Masalah lain adalah bahwa persepsi intensitas warna tidak sepenuhnya linier. Jadi, jika Anda memiliki ramp warna dari putih ke biru, yang sesuai dengan tidak ada kandidat yang menerima lebih banyak suara untuk lead maksimum untuk satu kandidat, warna yang 75% dari jalan antara putih dan biru mungkin tidak dianggap sebagai 75% dari jalan antara dua warna, dan oleh karena itu pengguna peta akan membuat asumsi yang salah tentang nilai data yang diwakilinya.
Peta yang diklasifikasi, di sisi lain, dapat memiliki warna dari masing-masing kelas yang dipilih dengan cermat untuk dirasakan secara jelas dan berbeda. Saya tidak cukup tahu untuk mendesain satu set warna yang melakukan ini, tetapi Cynthia Brewer dan Mark Harrower melakukannya, dan mereka menciptakan colorbrewer2.org , alat hebat (gratis) untuk membantu kartografer memilih skema warna yang bagus untuk peta mereka. Anda dapat memilih dari berbagai skema, memilih jumlah kelas, dan itu memberikan pratinjau seperti apa skema tersebut dalam praktiknya, dan nilai RBG, HEX, atau CMYK untuk setiap warna dalam skema. Sangat berguna, dan cukup menyenangkan untuk dimainkan.
Untuk alasan ini, saya akan merekomendasikan membuat peta berkelas. Jumlah kelas yang direkomendasikan biasanya angka ganjil dari 5-9 atau lebih. Menggunakan angka ganjil memberikan nilai rata-rata yang berbeda, dan jumlah kelas ini umumnya dianggap cukup untuk memberikan perbedaan yang berguna dalam data, tetapi tidak terlalu banyak sehingga tidak bisa dibedakan. Karena Anda menggunakan skema warna yang berbeda (warna terang di tengah, dua warna berbeda di setiap ujungnya), Anda bisa lolos dengan lebih banyak kelas, mungkin 7-9.
Pergi ke colorbrewer, pilih "diverging" untuk sifat data Anda, pilih skema warna merah ke biru, pilih jumlah kelas Anda, dan pergi!
Untuk sebagian besar dari ini, tidak ada aturan yang sulit. Standarnya adalah, "apakah peta mengomunikasikan data dengan baik?" Bermain-main dengan parameter sampai Anda mendapatkan sesuatu yang "berfungsi" bisa menjadi hal yang baik.
Sekarang, catatan tentang membuat choropleths. Saya minta maaf jika ini alasan yang akrab bagi Anda:
Suatu hal yang menarik ketika menggunakan peta yang dikelompokkan adalah bagaimana data dibagi menjadi kelas-kelas. Apakah rusak pada interval yang sama di sepanjang rentang? Apakah sejumlah titik data tertentu ditugaskan untuk setiap kelas? Sejumlah standar deviasi dari mean? Apakah rusak pada jeda "alami" dalam data? Metode mana yang Anda gunakan membuat perbedaan dalam bagaimana data digambarkan. Saya tidak banyak programmer, dan saya tidak yakin metode mana yang Anda gunakan untuk menggunakan skrip. "Istirahat alami" biasanya merupakan pilihan yang baik. Untuk data dengan titik tengah yang jelas seperti data polling (titik tengah menjadi perpecahan 50/50), standar deviasi dapat berguna.
Saat membuat choropleth, ada baiknya menggunakan data yang terstandarisasi pada satu unit area. Misalnya, daripada menggunakan total populasi di suatu daerah, lebih baik memetakan populasi per mil persegi di setiap daerah. Alasannya adalah bahwa area yang lebih besar akan cenderung memiliki lebih banyak orang di dalamnya daripada yang lebih kecil, sehingga membaginya dengan area setiap unit yang dipetakan memberikan gambaran tren yang lebih akurat. Data juga dapat distandarisasi sebagai persen. Misalnya, tingkat kemiskinan daripada sejumlah orang dalam kemiskinan.
Untuk keperluan Anda, lebih jelas untuk memetakan persentase suara yang diberikan untuk seorang kandidat daripada jumlah suara yang diberikan untuk kandidat itu.
Bagaimanapun, saya berharap beberapa dari ini berguna, dan bahwa peta Anda ternyata baik!
Untuk sebagian besar diskusi ini saya menggunakan Kartografi Tematik dan Geovisualisasi oleh Slocum et al.