Apakah ada "halo, dunia" untuk grafik statistik?


25

Dalam pemrograman komputer, ada program klasik pertama untuk belajar / mengajar bahasa atau sistem baru, yang disebut "halo, dunia". http://en.wikipedia.org/wiki/Hello_world_program

Apakah ada visualisasi data klasik pertama untuk menggunakan paket grafik? Jika demikian, apakah itu? Dan jika tidak, apa yang akan menjadi kandidat yang baik?


3
Selamat datang di situs kami! Faq kami memang bertanya bahwa "Anda seharusnya hanya mengajukan pertanyaan praktis yang dapat dijawab berdasarkan masalah aktual yang Anda hadapi." Bisakah Anda menguraikan apa masalah Anda yang sebenarnya?
whuber

3
Saya ingin mengidentifikasi "item tes standar" untuk grafik statistik, jika ada, untuk dimasukkan dalam materi pelatihan yang saya kembangkan.
Abraham D Flaxman

2
Karena aplikasi grafis sangat bervariasi, sulit untuk membayangkan beberapa grafik standar atau universal. Ada yang beberapa standar untuk jenis tertentu dari paket grafik, seperti kelinci historis terkenal dan teko untuk grafis 3D. Agar pertanyaan Anda dapat dijawab, maka, akan membantu untuk lebih spesifik tentang paket mana yang akan dibahas materi pelatihan Anda.
whuber

1
Poin bagus, terima kasih. Saya akan memasukkan setidaknya sesuatu tentang grafik statistik dalam R, STATA, Python, dan Javascript.
Abraham D Flaxman

@AbrahamDFlaxman Saya ingin tahu tentang "materi pelatihan" ini dan untuk siapa dan untuk apa. Bisakah Anda mengatakan lebih banyak?
Peter Flom - Pasang kembali Monica

Jawaban:


9

Dua pemikiran:

A. Ketika saya mencoba untuk mendapatkan esensi dari "Hello World", itu adalah minimum yang harus dilakukan dalam bahasa pemrograman untuk menghasilkan program yang valid yang mencetak satu baris teks. Itu menunjukkan kepada saya bahwa "Hello World" Anda harus merupakan kumpulan data univariat, hal paling mendasar yang dapat Anda hubungkan ke program statistik atau grafik.

B. Saya tidak mengetahui adanya grafik "Hello World". Yang paling dekat saya dapat datang adalah set data khas yang termasuk dalam berbagai paket statistik, seperti R's AirPassengers. Dalam R, pernyataan grafik Hello World adalah:

plot (AirPassengers)  # Base graphics, prints line graph

atau

qplot (AirPassengers) # ggplot2, prints a bar chart

atau

xyplot (AirPassengers) # lattice, which doesn't have a generic plot

Secara pribadi, saya pikir grafik paling sederhana adalah grafik garis di mana Anda memiliki item N di Y dan X berkisar dari 1: N. Tapi itu bukan standar.


1
Konsensus dari ini dan jawaban lainnya adalah bahwa saat ini tidak ada grafik grafis "halo, dunia". Saya pikir saran Anda tentang dataset univariat, dengan N item di Y dan X mulai dari 1: N menarik. Dalam analogi lebih jauh dengan "halo, dunia", alangkah baiknya jika memiliki N kecil, dan Y yang dapat diingat. Apa pendapat Anda tentang N = 5 dan Y = (3,1,4,1,5,9) (yaitu digit pi)? Mungkin itu terlalu matematika.
Abraham D Flaxman

1
@AbrahamDFlaxman: Saya tidak berpikir itu terlalu matematis, saya pikir itu hebat. Berkesan, pendek, dan grafik bukan hanya garis lurus atau apa pun. Data tersebut terkenal dan tidak terikat pada program tertentu, dan dapat diperpanjang secara sewenang-wenang oleh siapa saja yang menginginkan lebih banyak poin. Saya memilih itu!
Wayne

24

Saya mungkin akan mulai dengan sebar plot dan menunjukkan empat korelasi jelek .


2
+1. Tetapi Anda mungkin ingin mempertimbangkan sesuatu yang sedikit lebih umum, seperti beberapa bentuk alur cerita. Lagi pula, begitu Anda bisa menggambar segmen garis, Anda bisa menggambar apa saja . Ini menggemakan ide di balik "Halo, dunia!": Begitu Anda bisa mendapatkan output yang dapat dibaca dari suatu program, Anda tahu Anda dapat berkomunikasi dengan komputer dan sisanya hanya detail :-). (Perinciannya mungkin sulit . Ketika belajar menulis kode Assembly untuk mainframe IBM 360, cara paling sederhana untuk mendapatkan output adalah dengan menyimpannya dalam RAM dan membuat kesalahan pada akhir eksekusi, menyebabkan sistem untuk mencetak dump inti heksadesimal. !)
whuber

Saya pikir kuartet Anscombe secara total mengandung terlalu banyak untuk digunakan sebagai "halo, dunia" dari grafik statistik, tetapi Gambar 1 dari makalahnya bisa menjadi kandidat yang baik. Namun, jawaban lain telah membuat kasus untuk kumpulan data univariat, yang saya condong ke arah.
Abraham D Flaxman

7

Histogram sampel dari variabel acak berdistribusi normal.


Saya suka cara ini akan terlihat, tapi mungkin histogram membutuhkan lebih banyak pemrosesan data daripada mencerai-beraikan, dan datang dengan sampel dari distribusi normal mungkin mengganggu.
Abraham D Flaxman

Saya baru memperhatikan bahwa ini adalah contoh pertama dari halaman web Matplotlib: matplotlib.org
Abraham D Flaxman

5

Saya kira jawabannya adalah tidak". Artinya, tidak ada jawaban yang disepakati secara umum untuk pertanyaan Anda.

@StasK menunjuk ke scatterplot.

Tapi saya akan mempertimbangkan apa yang plotterjadi di R: Itu tergantung pada data!

Anda dapat berargumen bahwa statistik univariat lebih sederhana daripada statistik bivariat. Jadi ... mungkin yang paling mendasar adalah histogram; atau bar plot; mungkin plot kepadatan.

Jika intinya "Halo, Dunia!" adalah untuk menunjukkan bahwa Anda dapat membuat komputer melakukan sesuatu maka saya akan mengatakan plot apa pun akan dilakukan.


1
Mungkin tidak adanya item tes standar menunjukkan bahwa Anda benar, dan lebih tepat untuk menggunakan plot apa pun yang paling sederhana dalam sistem yang ditunjukkan. Namun itu membuat sulit untuk membandingkan.
Abraham D Flaxman

5

Tidak yakin apakah itu benar-benar memenuhi syarat sebagai hello world, tetapi di R ada juga demo yang dibuat dalam banyak paket. misalnya

library(graphics)
demo(graphics)

akan mengarahkan pengguna melalui beberapa grafik dasar yang tersedia dalam paket. Cukup klik mouse pada setiap gambar untuk menelusuri ilustrasi grafis dasar. Dengan hanya dua baris, pengguna diperkenalkan ke beberapa kemampuan grafis R yang menginspirasi untuk statistik.

Kode yang sesuai untuk menghasilkan grafik ditampilkan di konsol R.

masukkan deskripsi gambar di sini


2

Saya akan mengatakan ada dua jenis program "Hello World" untuk visualisasi data:

Print ("Hello World"): Sesuatu seperti histogram dari variabel yang terdistribusi normal, atau mungkin X, Y scatterplot sederhana.

Untuk sesuatu yang sedikit lebih kompleks, seperti bagian di mana seseorang mengambil prinsip Hello World dan mulai bermain dengan input pengguna, karakter melarikan diri dan sejenisnya, saya akan mengatakan itu akan bermain-main dengan set data Iris.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.