Apakah ada buku sains populer yang bagus tentang statistik atau pembelajaran mesin?


39

Ada banyak buku sains populer yang sangat bagus, yang berhubungan dengan sains nyata, serta sejarah dan alasan di balik teori saat ini, sambil tetap sangat menyenangkan untuk dibaca. Misalnya, "Kekacauan" oleh James Gleick (kekacauan, fraktal, nonlinier), "Sejarah singkat waktu" oleh Stephen Hawking (fisika, asal usul alam semesta, waktu, lubang hitam), atau "Gen Selfish Gene" oleh Richard Dawkins (evolusi dan seleksi alam). Beberapa dari buku-buku ini menyajikan argumen (Dawkins) dan beberapa tidak (Gleick). Tetapi mereka semua berfungsi untuk memudahkan kita yang tidak memiliki pendidikan ilmiah yang mendalam untuk memahami konsep yang sulit.

Apakah ada buku-buku seperti itu yang berfokus terutama pada Statistik, atau pembelajaran mesin?

Harap sertakan ringkasan dari apa yang dicakup setiap buku.


Saya sangat berani menambahkan ML ke judul, karena baik statistik dan ML adalah dua topik tingkat atas dari situs ini dan sebaliknya orang mungkin merasa tergoda untuk menanyakan pertanyaan yang sama untuk ML. Saya harap ini baik-baik saja.
steffen

2
(+1) ketika membaca buku seperti itu tentang topik yang saya tahu kadang-kadang ... menjengkelkan, jelas membantu untuk mendapatkan tampilan luar dan mudah-mudahan ide untuk menjelaskan konsep sulit kepada orang awam.
steffen

@steffen: ya, saya bertanya-tanya apakah saya harus memasukkan itu. Terus terang saya tidak tertarik pada ML saat ini, tetapi saya berasumsi jawaban akan mencakup buku-buku yang berhubungan dengan ML, karena dari perspektif pop-science, ML dan statistik pada dasarnya adalah hal yang sama. Ngomong-ngomong, senang memasukkannya, karena mungkin akan mendapatkan beberapa buku lagi, dan duplikasi tidak perlu :)
naught101

@ naught101 Bagaimana kalau menjadikan ini Wiki Komunitas?
Momo

@Momo: senang hal itu terjadi. Saya tidak bisa melakukannya sendiri.
naught101

Jawaban:


18

Saya curiga The Lady Tasting Tea , oleh David Salsberg persis seperti yang Anda inginkan. Ini sangat banyak ditulis dalam gaya naratif, hampir seperti novel, dengan dasarnya tidak ada matematika (seingat saya), sehingga akan dapat diakses oleh siapa pun. Saya membacanya sejak lama dan sangat menikmatinya. Bunyinya sangat cepat, dan bisa memberi orang perasaan tentang apa itu analisis statistik dan bagaimana itu bisa membantu kita memahami dunia dan memecahkan masalah praktis.


Ya, narasi sangat penting. Saya akan memasukkan itu dalam pertanyaan, tetapi beberapa contoh yang saya gunakan tidak memiliki narasi yang sangat baik (misalnya Dawkins), dan saya lupa.
naught101

3
Baru saja selesai membaca ini, dan itulah tepatnya yang saya cari, jadi terima kasih atas rekomendasinya. Saya menemukan kualitas penulisan yang cukup buruk, yang pada awalnya cukup mengganggu, tetapi saya terbiasa setelah beberapa saat. Materi yang dibahas sangat bagus, dan memberikan catatan sejarah yang bagus tentang dari mana statistik berasal, dan apa yang mendorong orang-orang membuat penemuan, dan membuat Anda melihat sekilas tentang apa yang akan datang, dan perasaan tentang kemungkinan menarik untuk mendapatkan lebih banyak terlibat di lapangan. Bisa lihat apakah saya bisa mendapatkan beberapa teman yang membenci statistik saya untuk membacanya :)
naught101


8

Lebih banyak bacaan bagus:

The Flaw of Averages oleh Sam L. Savage

Tertipu Oleh Keacakan oleh Nassim Taleb

Keduanya agak buku peringatan tentang berhati-hati terhadap cara menafsirkan probabilitas dan statistik dalam kehidupan kita sehari-hari. Sebagai contoh, di pasar keuangan, seseorang dapat menyalahgunakan distribusi gaussian sehari-hari sebagai ukuran risiko dengan konsekuensi bencana, dan dengan demikian kita mungkin ingin menggunakan model yang lebih empiris (seperti simulasi monte carlo) dalam praktiknya. Taleb sangat populer di kalangan keuangan, dan sering memperingatkan kita untuk lebih berhati-hati tentang bias perilaku dan terlalu bergantung pada pemodelan


8

"The Theory That Would Not Die" oleh Sharon Bertsch McGrayne adalah buku yang sangat mudah dibaca tentang sejarah statistik Bayesian dan gagasan umum di baliknya tanpa terlalu macet dalam matematika.

Saya juga penggemar "Panduan Kartun untuk Statistik" oleh Gonnick dan Smith sebagai pengantar yang bagus untuk konsep umum statistik dengan beberapa matematika, tetapi disajikan dengan cara yang tidak membuat Anda tertidur (saya juga punya panduan kartun untuk genetika, fisika, dan kimia dan telah membaca beberapa yang lain).


6

Saya akan menyarankan buku-buku berikut, meskipun tidak ada yang ideal, Anda harus memeriksa:

  1. The (Mis) Behavior of Market oleh (the great) B. Mandelbrot
  2. Struck By Lightening oleh Jefferey Rosenthal

dengan mantan lebih fokus pada keuangan, tetapi masih statistik, dan yang terakhir adalah pengantar semua mata pelajaran probabilitas yang menarik: peluang, masalah Monty Hall, fungsi utilitas, jalan acak dll.


5

Buku yang sangat bagus untuk membantu literasi statistik dasar dan penalaran statistik - dan untuk menjadikan kasus ini penting - adalah The Tiger That Isn't oleh Andrew Dilnot, mantan presenter acara radio populer tentang statistik terapan untuk BBC.

Saya sering merekomendasikannya sebagai statistik yang setara dengan buku sains pop terkenal Bad Science oleh Ben Goldacre. Ini baik untuk memperkenalkan penalaran statistik dasar, untuk menunjukkan pentingnya penalaran statistik dasar, dan membuat orang khawatir tentang kurangnya alasan statistik dasar di antara orang-orang yang benar-benar harus tahu lebih baik (terutama politisi, jurnalis, dll). Sangat mudah diakses, menarik, lucu di berbagai tempat, sangat mengkhawatirkan orang lain! Terutama bagus sebagai pengantar bagi siapa saja yang menganggap angka sebagai 'bukan barang mereka'.


4

Ian Ayres adalah penulis buku "Super Crunchers: Why Think-by-Numbers Adalah Cara Baru untuk Menjadi Cerdas" yang membahas beberapa contoh penggalian data.


3

Saya pikir saya akan mengisi kekosongan di sini dengan menunjukkan beberapa buku gaya pasar massal yang bagus tentang set fuzzy, teori informasi, entropi dan penalaran statistik yang saya baca dan sangat rekomendasikan.

• Untuk semua hal yang kabur, titik awal informal yang baik adalah McNeill, Dan, 1993, Fuzzy Logic. Simon & Schuster: New York.

• Untuk pasar massal yang baik ke jaringan syaraf, diorganisir di sekitar beberapa spekulasi menarik tentang organisasi otak manusia, lihat Hawkins, Jeff, 2004, On Intelligence. Times Books: New York.

Untuk pengantar yang mudah dibaca untuk topik-topik penting seperti jebakan statistik dan alasan yang keliru, cobalah tiga hal berikut:

• Huff, Darrell, 1954, Cara Berbohong dengan Statistik. WW Norton & Company New York.

• Kault, David, 2003, Statistik dengan Common Sense. Greenwood Press: Westport, Connecticut.

• Smith, Gary, 2014, Penyimpangan Standar: Asumsi yang Cacat, Data yang Disiksa dan Cara Lain untuk Berbohong dengan Statistik. Abaikan Pers: New York.

Berikut ini semua terkait dengan teori informasi dan entropi:

• Lucky, RW, 1989, Silicon Dreams: Information, Man, and Machine. St Martin's Press: New York.

• Penulis ini melakukan pekerjaan yang sangat baik dalam meletakkan teori informasi dalam konteks dan menunjukkan penyalahgunaannya, sambil masih menulis dengan cara yang tidak dipahami oleh seorang spesialis: Pierce, John Robinson, 1961, Simbol, Sinyal, dan Suara: Alam dan Proses Komunikasi. Harper: New York.

• Saya membaca judul yang serupa ini, tetapi tidak dapat mengingat apakah ini adalah edisi berikutnya atau tindak lanjut: Pierce, John Robinson, 1980, An Pengantar Teori Informasi: Simbol, Sinyal & Noise. Dover Publications: New York.

• Jika saya ingat benar, penulis ini mudah dibaca, sementara masih masuk ke beberapa konsep yang lebih maju: Brillouin, Léon, 1964, Sains, Ketidakpastian dan Informasi. Pers Akademik: New York.

• Juga lihat Brillouin, Léon, 1962, Teori Sains dan Informasi. Pers Akademik: New York.

• Saya membaca ini sejak lama, tetapi percaya penulis ini dapat dibaca dan memiliki beberapa pengamatan menarik tentang teori informasi: Bar-Hillel, Yehoshua, 1964, Bahasa dan Informasi: Esai Terpilih Pada Teori dan Aplikasi Mereka. Addison-Wesley Pub. Co Membaca, Misa.

Saya ingin mengingatkan bahwa buku-buku pasar massal tentang topik-topik yang mengejutkan seperti kekacauan, informasi, fisika kuantum, probabilitas, keacakan, "Sibernetika," pengorganisasian mandiri, perangkat fuzzy, dan kecerdasan buatan mengandung sejumlah kecil materi penting yang dihancurkan jalan keluar dari proporsi, kadang-kadang sampai tidak valid secara logis. Masing-masing teori ini memiliki pendukung terkenal yang tidak tahu kapan harus berhenti dengan hal yang baik dan membuat lompatan logis besar untuk mengubah bidang khusus mereka menjadi penjelasan muluk dari segala sesuatu. Masing-masing memiliki penulis yang jauh melampaui bukti, bahkan sampai mengabaikan peringatan eksplisit oleh para pendiri bidang mereka, seperti yang dilakukan Shannon tentang penyalahgunaan entropi informasi. Ada demam, warna tidak sehat untuk tulisan mereka, yang kadang-kadang memenuhi syarat sebagai ilmu sampah yang diproduksi oleh engkol. Saya dapat menyebutkan beberapa nama terkenal yang terus mencetak hal-hal keterlaluan tentang topik-topik ini, berdasarkan pada kesalahan logika yang jelas dan kadang-kadang poin fakta yang keliru. Saya tidak akan melakukan itu di sini untuk menghindari perang api yang serius, karena saya harus memanggil beberapa berhala dan sapi suci. Perlu diketahui bahwa bahan yang menyesatkan semacam ini ada di luar sana dan siap untuk menandai itu. Hati-hati dengan klaim luar biasa tanpa bukti luar biasa yang diperlukan.


2

Drunkard's Walk oleh Leonard Mlodinow adalah pengantar statistik dan probabilitas dasar yang mudah dibaca. Konten ini ditujukan untuk audiens yang tidak memiliki pelatihan statistik atau matematika, dan tidak ada persamaan. Saya menemukan itu agak terlalu bodoh. Ada banyak anekdot yang menghubungkan berbagai aplikasi statistik buruk, dan penjelasan yang jelas mengapa mereka salah.

Buku ini mencakup statistik dasar dan probabilitas bersyarat.


1

Numbers Rule Your World , oleh Kaiser Fung, menjelaskan pentingnya statistik dalam banyak sistem yang mendasar bagi masyarakat modern, seperti pasar asuransi.

Number Sense , juga oleh Kaiser Fung, berbicara tentang "data besar" lebih khusus.


0

Algoritma Master: Bagaimana Pencarian untuk Mesin Pembelajaran Utama Akan Membuat Kembali Dunia Kita adalah sebuah buku karya Pedro Domingos yang dirilis pada tahun 2015. Domingos menulis buku untuk menghasilkan minat dari orang-orang di luar lapangan.

Buku ini menguraikan lima suku pembelajaran mesin: penalaran induktif, koneksionisme, perhitungan evolusioner, teorema Bayes dan pemodelan analogis. Penulis menjelaskan suku-suku ini kepada pembaca dengan merujuk pada proses logika yang lebih dimengerti, koneksi yang dilakukan di otak, seleksi alam, probabilitas dan penilaian kesamaan. Di sepanjang buku ini, disarankan agar setiap suku yang berbeda memiliki potensi untuk berkontribusi pada "algoritma utama" pemersatu.

https://en.m.wikipedia.org/wiki/The_Master_Algorithm

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.