Dalam [1, §3.2], David Freedman menyarankan jawaban yang pada dasarnya negatif untuk pertanyaan Anda. Artinya, tidak ada (hanya) model statistik atau algoritma yang bisa menyelesaikan masalah John Snow. Masalah Snow adalah mengembangkan argumen kritis yang mendukung teorinya bahwa kolera adalah penyakit menular yang ditularkan melalui air, terhadap teori racun yang berlaku pada zamannya. (Bab 3 dalam [1], berjudul “Model Statistik dan Kulit Sepatu,” juga tersedia dalam bentuk yang diterbitkan sebelumnya [2] di sini .)
Dalam beberapa halaman pendek ini [1, hal.47–53], banyak di antaranya merupakan kutipan lanjutan dari John Snow sendiri, Freedman berpendapat bahwa "apa yang sebenarnya dilakukan Snow pada 1853–54 bahkan lebih menarik daripada dongeng [Broad] Street Pump]. " Sejauh membuat bukti statistik (pendahuluan lain seperti identifikasi kasus indeks, dll., Dibahas di samping), Snow mengeksploitasi variasi alami untuk menghasilkan eksperimen semu yang benar-benar luar biasa.
Ternyata pada waktu sebelumnya, ada persaingan ketat di antara perusahaan penyedia air di London, dan ini menghasilkan pencampuran spasial dari pasokan air yang (dalam kata-kata Snow) "dari jenis yang paling intim."
Pipa-pipa dari masing-masing Kompi turun ke semua jalan, dan ke hampir semua lapangan dan gang. Beberapa rumah dipasok oleh satu Perusahaan dan beberapa oleh yang lain, sesuai dengan keputusan pemilik atau penghuni pada saat itu ketika Perusahaan Air berada dalam persaingan aktif.
...
Karena tidak ada perbedaan apa pun di rumah-rumah atau orang-orang yang menerima pasokan dari dua Perusahaan Air, atau dalam kondisi fisik dengan mana mereka dikelilingi, jelas bahwa tidak ada percobaan yang dapat dilakukan yang akan lebih teliti menguji efek pasokan air pada kemajuan kolera dari ini, yang keadaan siap dibuat sebelum pengamat.
—John Snow
Bagian lain yang sangat penting dari 'variasi alami' yang dieksploitasi oleh John Snow dalam percobaan semu ini adalah bahwa satu perusahaan air memiliki asupan air di hilir Sungai Thames di hilir pembuangan limbah , sedangkan yang lainnya memiliki beberapa tahun sebelum memindahkan asupannya ke hulu . Saya akan membiarkan Anda menebak yang mana dari tabel data John Snow!
| Jumlah | Kolera | Kematian per
Perusahaan | rumah | kematian | 10.000 rumah
-------------------------------------------------- --------
Southwark & Vauxhall | 40.046 | 1263 | 315
Lambeth | 26.107 | 98 | 37
Sisa dari London | 256.423 | 1422 | 59
Sebagai Freedman mencatat dengan sedih,
Sebagai bagian dari teknologi statistik, [tabel di atas] tidak berarti luar biasa. Namun kisah yang diceritakannya sangat persuasif. Kekuatan argumen tersebut dihasilkan dari kejelasan penalaran sebelumnya, penyatuan berbagai garis bukti, dan jumlah kulit sepatu yang bersedia digunakan Snow untuk mendapatkan data. [1, hal.51]
Satu poin lebih lanjut dari variasi alami yang dieksploitasi oleh Snow terjadi dalam dimensi waktu : relokasi asupan air yang disebutkan di atas terjadi di antara dua epidemi, memungkinkan Snow untuk membandingkan air perusahaan yang sama dengan dan tanpa tambahan limbah. (Terima kasih kepada Philip B. Stark, salah satu penulis [1], untuk info ini melalui Twitter . Lihat kuliah online -nya.)
Hal ini juga memberikan studi instruktif dalam kontras antara deductivism dan inductivism , seperti yang dibahas dalam jawaban ini .
Freedman D, Collier D, Sekhon JS, Stark PB. Model Statistik dan Inferensial Kausal: Dialog dengan Ilmu Sosial. Cambridge; New York: Cambridge University Press; 2010
Freedman DA. Model Statistik dan Kulit Sepatu. Metodologi Sosiologis . 1991; 21: 291-313. doi: 10.2307 / 270939. Teks lengkap