Sumber daya untuk belajar membuat visualisasi data?


19

Saya tertarik mempelajari cara membuat jenis visualisasi yang Anda lihat di http://flowingdata.com dan informasinya bagus. EDIT: Artinya, visualisasi yang menarik dalam diri mereka sendiri - agak seperti grafik NY Times, bukan sesuatu yang cepat untuk laporan.

Apa jenis alat yang digunakan untuk membuat ini - apakah sebagian besar banyak Adobe Illustrator / Photoshop? Apa sumber daya yang baik (buku, situs web, dll.) Untuk belajar bagaimana menggunakan alat ini untuk visualisasi data khususnya?

Saya tahu seperti apa visualisasi yang saya inginkan (dan saya akrab dengan prinsip-prinsip desain, misalnya, dari buku-buku Tufte), tetapi saya tidak tahu cara membuatnya.

Jawaban:


20

Mengalir data secara teratur membahas alat yang ia gunakan. Lihat, misalnya:

Dia juga menunjukkan dengan sangat rinci bagaimana dia membuat gambar pada suatu kesempatan, seperti:

Ada juga pertanyaan lain di situs ini:

IMO, coba:

  1. R dan ggplot2: ini adalah video pengantar yang bagus , tetapi situs web ggplot2 memiliki banyak sumber daya.
  2. Memproses: banyak tutorial bagus di beranda .
  3. Protovis: juga banyak contoh bagus di beranda .

Anda dapat menggunakan Adobe setelah itu untuk membersihkannya.

Anda juga dapat melihat webvispaket R , meskipun tidak selengkap ggplot2. Dari R, Anda dapat menjalankan perintah ini untuk melihat contoh Gandum Playfair:

install.packages("webvis")
library(webvis)
demo("playfairs.wheat")

Terakhir, aplikasi komersial favorit saya untuk visualisasi interaktif adalah:


1
Tautan luar biasa, bagus! Saya sudah menggunakan R dan ggplot2, tetapi visualisasi dari sana tampaknya lebih dari "grafik untuk laporan" -berbagai, daripada "eye candy / visualisasi yang menarik dengan sendirinya" -beragam yang saya cari. (ggplot2 super indah, tetapi itu tidak benar-benar dimaksudkan untuk memungkinkan kreativitas tanpa batas.) Apakah saya salah ?, atau Anda kadang-kadang menggunakan R / ggplot2 sebagai input ke alat visualisasi lain?
raegtin

5

Pemrosesan yang telah disebutkan memiliki seperangkat buku bagus yang tersedia. Lihat: 1 , 2 , 3 , 4 , 5 , 6 , 7

Anda akan menemukan banyak hal di web untuk membantu Anda memulai dengan R. Seperti langkah selanjutnya maka ggplot2 memiliki dokumentasi web yang luar biasa . Saya juga menemukan buku Hadley sangat membantu.

Python mungkin cara lain untuk pergi. Terutama dengan alat-alat seperti:

Semua proyek didokumentasikan dengan baik di web. Anda mungkin juga mempertimbangkan mengintip ke dalam beberapa buku .

Terakhir, buku Graphics of Large Datasets juga bisa membantu.


igraphbekerja di R juga; untuk 3D openGL yang dipercepat vis di R, gunakan rgl& misc3dpaket.

Juga matplotlibplot jelek; mereka mungkin baik untuk pengguna gnuplot bertahun-tahun.

2

Anda akan menghabiskan banyak waktu untuk mempercepat dengan R.

RapidMiner adalah sumber terbuka dan bebas dan grafis, dan memiliki banyak visualisasi yang baik, dan Anda dapat mengekspornya.

Jika Anda memiliki uang cadangan, atau staf / mahasiswa universitas maka JMP juga sangat bagus. Itu dapat membuat beberapa grafik yang sangat cantik, dengan sangat mudah. Dapat mengekspor ke flash atau PNG atau PDF atau apa pun.


5
1. IMHO waktu yang dihabiskan dengan R diinvestasikan dengan baik jika Anda berencana untuk melakukan sesuatu yang serius. 2. Juga pertimbangkan KNIME knime.org sebagai alternatif RapidMiner .
radek

(+1) @radek. Saya juga penggemar quickminer, tetapi menurut saya itu tidak cukup fleksibel untuk visualisasi yang canggih.
steffen

Jika Anda memiliki pengalaman pengkodean, maka Anda tidak akan benar-benar membutuhkan lebih dari satu hari atau lebih untuk mempercepat dengan R. Ini cukup mudah, sejauh bahasa berjalan, dan ada beberapa tutorial online yang bagus.
naught101

1

Alternatif lain yang bagus adalah perpustakaan protovis http://vis.stanford.edu/protovis/

Ini adalah pustaka JavaScript yang dibuat dengan sangat baik yang dapat membuat beberapa visualisasi yang indah jika Anda memiliki waktu dan kemampuan untuk menulis jumlah kode JavaScript yang diperlukan.

Saya juga sangat merekomendasikan Tableau http://www.tableausoftware.com . Ini bagus untuk mengeksplorasi set data dengan cepat dan membuat banyak visualisasi yang berbeda.

Kedua produk memiliki akar di Stanford Visualization Group.


1

Banyak jawaban luar biasa telah diberikan di sini, dan bahasa / perpustakaan yang Anda pilih untuk belajar akan tergantung pada jenis visualisasi yang ingin Anda lakukan.

Namun, jika Anda menggunakan Python secara teratur maka saya sangat merekomendasikan seaborn . Sangat canggih dalam hal visualisasi data statistik, tetapi juga terlihat cukup canggih dari sudut pandang presentasi.

Mari kita ambil contoh. Misalkan Anda mencoba merencanakan konsumsi listrik untuk bangunan komersial berdasarkan bulan. Grafik garis sederhana dapat dihasilkan di matplotlib untuk tujuan ini.

Namun, jika kami ingin membuat visualisasi lebih canggih dan informatif, kami dapat menghasilkan peta panas dengan seaborn:

peta panas

Heatmap hanyalah satu contoh. Beberapa kegunaan umum lainnya dengan seaborn meliputi:

  • Plot KDE
  • Plank segerombolan
  • Plot biola

Gagasan di balik seaborn adalah untuk menyajikan data dengan cara yang lebih intuitif daripada yang mungkin dilakukan dengan menggunakan grafik yang lebih sederhana, misalnya garis, batang, pai, dll.

Jika ini menarik bagi Anda - Anda dapat menemukan informasi lebih lanjut tentang seaborn di sini: https://seaborn.pydata.org/



0

R itu hebat, tetapi bukan berarti R sulit untuk dipelajari, bahwa dokumentasi tidak mungkin untuk mencari nama lain seperti Rq akan bagus. Jadi ketika Anda mendapat masalah, mencari solusi adalah mimpi buruk, dan dokumentasinya juga tidak bagus. Matlab atau Oktaf akan bagus. Dan untuk mendapatkan plot di R atau Matlab akan sangat membosankan.

Visual pasca pemrosesan IMHO adalah rute terbaik. Banyak dari mereka dari data yang mengalir dimasukkan melalui Adobe Illustrator atau Gimp. Lebih cepat. Setelah Anda mendapatkan struktur plot, kemudian ubah detail di editor. Menggunakan R sebagai editor tidak memberi Anda fleksibilitas yang Anda inginkan. Anda akan menemukan diri Anda mencari paket baru setiap saat.


R; function??- R memiliki bantuan bawaan. Anda juga biasanya dapat mencari "cran" untuk menemukan hal-hal R, dan saya menemukan bahwa sebagian besar mesin pencari utama dapat menangani huruf tunggal dengan cukup baik.
naught101



-3

Ada sumber daya tak terbatas, tetapi Anda dapat mempersempitnya berdasarkan pada bagaimana Anda ingin data Anda ditransformasikan, berapa banyak sumber data yang Anda hadapi, bagaimana mereka perlu dibagikan, dll.

Berikut adalah panduan tentang cara memilih sumber daya yang tepat yang dapat membantu mengarahkan Anda ke arah yang benar.


1
Saat Anda dikaitkan dengan grup ini, harap nyatakan minat. Jawaban hanya tautan bukan yang paling membantu. Saran di stats.stackexchange.com/help/promotion mungkin berlaku.
Nick Cox
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.