Saya telah membaca buku Tukey "Analisis Data Eksplorasi". Ditulis pada tahun 1977, buku ini menekankan metode kertas / pensil. Apakah ada penerus yang lebih 'modern' yang memperhitungkan bahwa kita sekarang dapat langsung memplot set data besar?
Saya telah membaca buku Tukey "Analisis Data Eksplorasi". Ditulis pada tahun 1977, buku ini menekankan metode kertas / pensil. Apakah ada penerus yang lebih 'modern' yang memperhitungkan bahwa kita sekarang dapat langsung memplot set data besar?
Jawaban:
Yang paling dekat adalah Data Visualisasi Cleveland . Ini tentang Analisis Data Eksplorasi, ini tentang visualisasi yang dihasilkan komputer, ini mendalam, ini klasik.
Yah, ini bukan replika yang tepat, tapi saya menemukan banyak saran merencanakan yang berguna (dan kode R) dalam Analisis Data Gelman dan Hill menggunakan Regresi dan Model Multilevel / Hierarchical
Selain itu, blognya sering penuh dengan saran grafis yang bermanfaat.
Grafik Interaktif untuk Analisis Data: Prinsip dan Contoh adalah yang saya sukai; deskripsi buku mengatakan itu "membahas analisis data eksplorasi (EDA) dan bagaimana metode grafis interaktif dapat membantu mendapatkan wawasan serta menghasilkan pertanyaan dan hipotesis baru dari dataset."
Buku ggplot2 Hadley Wickham menarik karena mengajarkan baik Grammar of Graphics dan cara menggunakan perangkat lunak ggplot2.
Data Eksplorasi Ronald Pearson di bidang Teknik, Ilmu, dan Kedokteran layak disebutkan di sini. Target pembaca utamanya adalah para ilmuwan yang tidak takut pada matematika kecil yang berharap mereka tahu lebih banyak statistik. Itu adalah kelompok yang cukup besar, dan satu diwakili dengan baik di sini. Agak aneh dan tidak biasa, tetapi mencakup banyak hal dan termasuk banyak saran yang masuk akal. Bukan Tukey yang ditinjau kembali dalam arti menawarkan banyak ide baru, tetapi bisa bermanfaat untuk belajar, bahkan ketika Anda berpikir itu sedikit salah kaprah.
Buku ini tampaknya telah menarik perhatian sangat sedikit, sangat mungkin karena sangat mahal, tidak jelas cocok sebagai teks saja, dan sampai sekarang hanya tersedia dalam bentuk bersampul tebal. Tapi itu cerdas dan mudah dibaca dan bebas dari sampah buku pelajaran pengantar modern (halaman dan halaman latihan dasar, ikon konyol, foto serampangan orang muda yang bahagia, tata letak rewel dengan kotak, apa pun, dll).
Ini memiliki dua bab yang tersedia untuk umum di web yang menggambarkan proses analisis data, dan menangani nilai yang hilang. Ada buku baru yang akan segera diterbitkan oleh Antony Unwin.
Sepasang buku bagus lainnya untuk dibaca adalah Visualisasi Cantik dan Data Cantik. Ini adalah buku yang diedit, ada contoh luar biasa yang baik untuk mengeksplorasi data dengan plot, dan beberapa bab yang benar-benar mengerikan.
Buku lain yang memiliki beberapa contoh bagus menggunakan ggplot2 adalah yang baru oleh Winston Chang
Saya memikirkan Memahami analisis yang kuat dan eksplorasi oleh Hoaglin, Mosteller dan Tukey dan volume pendamping pada Menjelajahi tabel dan bentuk data sebagai tindak lanjut teknis untuk EDA. Saya juga melihat analisis data dan regresi, kursus kedua dalam statistik oleh Mosteller dan Tukey sebagai tindak lanjut EDA. Berbagai buku Cleveland yang disebutkan di atas adalah harta karun.