Contoh untuk mengajar: Korelasi tidak berarti sebab-akibat


74

Ada pepatah lama: "Korelasi tidak berarti sebab akibat". Ketika saya mengajar, saya cenderung menggunakan contoh-contoh standar berikut untuk menggambarkan hal ini:

  1. jumlah bangau dan tingkat kelahiran di Denmark;
  2. jumlah imam di Amerika dan alkoholisme;
  3. pada awal abad ke-20 tercatat bahwa ada korelasi kuat antara 'Jumlah radio' dan 'Jumlah orang di Rumah Sakit Gila'
  4. dan favorit saya: bajak laut menyebabkan pemanasan global .

Namun, saya tidak punya referensi untuk contoh-contoh ini dan walaupun lucu, mereka jelas salah.

Adakah yang punya contoh bagus lainnya?


2
Telusuri Freakonomics untuk beberapa contoh hebat. Daftar pustaka mereka penuh dengan referensi.
Stephen Turner


5
Grafik perompak / pemanasan global ini jelas dibuat oleh para ahli teori konspirasi - siapa pun dapat melihat bahwa mereka telah sengaja merencanakan bahkan mengatur jarak untuk periode waktu yang tidak sama untuk menghindari menunjukkan kenaikan suhu yang tajam baru-baru ini karena para perompak hampir seluruhnya musnah. Kita semua tahu bahwa ketika suhu naik itu membuat rum menguap dan bajak laut tidak dapat bertahan dari kondisi itu. ;-)
AdamV

4
WTF dengan sumbu x pada grafik bajak laut itu?
nucky101

1
Atau hampir semua yang Anda masukkan ke Google Correlate , lakukan itu.
conjugateprior

Jawaban:


39

Mungkin bermanfaat untuk menjelaskan bahwa "sebab" adalah hubungan asimetris (X sebab Y berbeda dari Y sebab X), sedangkan "berkorelasi dengan" adalah hubungan simetris.

Misalnya, populasi tuna wisma dan tingkat kejahatan mungkin berkorelasi, karena keduanya cenderung tinggi atau rendah di lokasi yang sama. Sama validnya dengan mengatakan bahwa populasi tunawisma berkorelasi dengan tingkat kejahatan, atau tingkat kejahatan berkorelasi dengan populasi tunawisma. Untuk mengatakan bahwa kejahatan menyebabkan tuna wisma, atau populasi tuna wisma menyebabkan kejahatan adalah pernyataan yang berbeda. Dan korelasi tidak menyiratkan bahwa keduanya benar. Misalnya, penyebab yang mendasari bisa menjadi variabel ke-3 seperti penyalahgunaan narkoba, atau pengangguran.

Matematika statistik tidak baik dalam mengidentifikasi penyebab yang mendasarinya, yang membutuhkan beberapa bentuk penilaian lainnya.


3
Penghakiman adalah kata yang baik, karena yang bisa kita amati hanyalah korelasi. Semua yang dapat dilakukan percobaan dan / atau statistik pintar adalah memungkinkan kami untuk mengecualikan beberapa penjelasan alternatif untuk apa yang dapat menyebabkan efek.
Jonas

Komentar yang sangat bagus tentang hubungan simetris / asimetris. Orang juga mungkin mengklaim bahwa pemanasan global menyebabkan pembajakan meningkat.
Andre Holzner

27

Kesukaanku:

1) Semakin banyak petugas pemadam kebakaran dikirim ke api, semakin banyak kerusakan yang terjadi.

2) Anak-anak yang mendapat bimbingan belajar mendapat nilai lebih buruk daripada anak-anak yang tidak mendapatkan bimbingan belajar

dan (ini yang teratas)

3) Pada tahun-tahun awal sekolah dasar, tanda astrologi berkorelasi dengan IQ, tetapi korelasi ini melemah dengan bertambahnya usia dan menghilang pada usia dewasa.


2
(@xmjx Disediakan contoh pertama tahun lalu.) Saya suka contoh astrologi.
whuber

Bisakah Anda menjelaskan sampel dengan tanda astrologi?
Eugene D. Gubenkov

2
Sudahlah, saya mengerti. Itu ada hubungannya dengan perbedaan usia antara yang lahir pada awal tahun dan yang lahir pada akhir. Bagus.
Eugene D. Gubenkov

24

Saya selalu menyukai yang ini:

lemon vs kematian

sumber: http://pubs.acs.org/doi/abs/10.1021/ci700332k


1
Bagus, tapi saya tidak bisa melihat ada orang yang mencoba menarik kesimpulan sebab akibat di sana. Atau apakah pengemudi truk lemon Meksiko terkenal berbahaya begitu mereka melewati perbatasan?
AdamV

2
Jelas efek samping yang tidak terduga dari banyaknya hukum lemon di AS. Sebagai contoh, lihat: en.wikipedia.org/wiki/Lemon_law
Thylacoleo

11
Seorang kolega saya melihat data untuk ini pada periode pasca-2000, dan menemukan bahwa hubungan tersebut berlangsung cukup baik 'di luar sampel', yang bahkan lebih mengganggu ...
shabbychef


Rasionalisasi yang sederhana adalah bahwa keduanya berkurang seiring waktu. Apakah data pasca-2000 mendukung itu? PS, Box Hunter dan Hunter (lihat di bawah) menjelaskan contoh bangau dengan cara yang sama: keduanya meningkat seiring waktu selama periode tersebut.
Emil Friedman

23
  1. Terkadang korelasi cukup. Misalnya, dalam asuransi mobil, pengemudi laki-laki berkorelasi dengan lebih banyak kecelakaan, sehingga perusahaan asuransi membebankan biaya lebih besar kepada mereka. Tidak mungkin Anda benar-benar dapat menguji penyebab ini. Anda tidak dapat mengubah jenis kelamin driver secara eksperimental. Google telah menghasilkan ratusan miliar dolar tidak peduli tentang penyebabnya.

  2. Untuk menemukan sebab-akibat, Anda biasanya memerlukan data eksperimental, bukan data observasi. Meskipun, dalam ilmu ekonomi, mereka sering menggunakan "kejutan" yang diamati pada sistem untuk menguji sebab-akibat, seperti jika seorang CEO mati mendadak dan harga saham naik, Anda dapat mengasumsikan sebab-akibat.

  3. Korelasi adalah kondisi yang diperlukan tetapi tidak cukup untuk menyebabkan. Untuk menunjukkan sebab akibat dibutuhkan suatu fakta yang berlawanan.


1
Saya suka contoh pertama yang Anda berikan. Itu pasti akan membuat para siswa berbicara;)
csgillespie

1
Ada diskusi yang menarik oleh Steve Steinberg di blog-nya di sini: blog.steinberg.org/?p=11 tentang beberapa implikasi dari 1 dan di mana ia mengarah dalam hal AI yang Lemah.
Amos

Bisakah seseorang memperluas sedikit kalimat terakhir?
nucky101

4
X(1,1)Y(0,1)Y=1X2XsXY

18

Saya punya beberapa contoh yang ingin saya gunakan.

  1. Ketika menyelidiki penyebab kejahatan di New York City pada 80-an, ketika mereka berusaha membersihkan kota, seorang akademisi menemukan korelasi kuat antara jumlah kejahatan serius yang dilakukan dan jumlah es krim yang dijual oleh pedagang kaki lima! (Yang merupakan penyebab dan yang merupakan efeknya?) Jelas, ada variabel yang tidak diamati yang menyebabkan keduanya. Musim panas adalah saat kejahatan terbesar dan saat es krim paling banyak dijual.

  2. Ukuran telapak tangan Anda berkorelasi negatif dengan berapa lama Anda akan hidup (sungguh!). Faktanya, wanita cenderung memiliki telapak tangan yang lebih kecil dan hidup lebih lama.

  3. [Favorit saya] Saya pernah mendengar sebuah penelitian beberapa tahun yang lalu yang menemukan bahwa jumlah soda yang diminum seseorang berkorelasi positif dengan kemungkinan obesitas.(Saya berkata pada diri saya sendiri - itu masuk akal karena itu pasti karena orang minum soda manis dan mendapatkan semua kalori kosong itu.) Beberapa hari kemudian lebih banyak rincian yang keluar. Hampir semua korelasinya adalah karena peningkatan konsumsi minuman ringan diet. (Itu mengacaukan teoriku!) Jadi, ke arah mana penyebabnya? Apakah diet minuman ringan menyebabkan seseorang menambah berat badan, atau apakah kenaikan berat badan menyebabkan peningkatan konsumsi minuman ringan diet? (Sebelum Anda menyimpulkan itu adalah yang terakhir, lihat studi di mana percobaan terkontrol dengan tikus menunjukkan kelompok yang diberi yogurt dengan pemanis buatan naik lebih berat daripada kelompok yang diberi yogurt normal.) Dua referensi: Minum Lebih Banyak Diet Soda , Menambah Lebih Berat? ; Soda diet terkait dengan obesitas. Saya pikir mereka masih mencoba untuk menyelesaikan ini.


4
Yang terakhir sedikit lebih rumit daripada yang Anda sajikan, tetapi saya setuju banyak asosiasi pengamatan yang ditemukan antara soda / diet soda dan obesitas harus dilihat dengan mata kritis. Secara teoritis beberapa orang berpendapat bahwa pengganti gula / lemak palsu memiliki efek fisiologis lain di luar asupan kalori sederhana. Lihat misalnya percobaan ini pada tikus dan lemak sintetis (diambil dari blog Freakonomics).
Andy W

18

Jumlah hadiah Nobel yang dimenangkan oleh suatu negara (menyesuaikan populasi) berkorelasi baik dengan konsumsi cokelat per kapita. ( Jurnal Kedokteran New England )

masukkan deskripsi gambar di sini


2
+1 Saya sangat kecewa dengan NEJM ketika mereka menerbitkan ini
MattBagg

5
Tampaknya juga berkorelasi cukup baik dengan kedekatan dengan Swedia ..
naught101

2
Konsumsi cokelat (per kapita) juga secara signifikan berkorelasi dengan jumlah pembunuh berantai per kapita. replicatedtypo.com/…
Harvey Motulsky

2
Saya bertanya kepada tiga pemenang Hadiah Nobel yang saya (samar-samar) tahu, dan ketiganya mengatakan bahwa mereka makan cokelat jauh lebih banyak daripada kebanyakan rekan mereka. Tentu saja, jawaban ini datang setelah mereka membaca makalah NEJM!
Harvey Motulsky

4
@MattBagg Ini diterbitkan sebagai "Catatan Sesekali" dan jelas tidak dianggap serius.
Pascal


9

Ada dua aspek untuk masalah post hoc ergo propter hoc ini yang ingin saya bahas: (i) membalikkan kausalitas dan (ii) endogenitas

Sebuah contoh dari "kemungkinan" membalikkan kausalitas: Minum dan penghasilan sosial - peminum menghasilkan lebih banyak uang menurut Bethany L. Peters & Edward Stringham (2006. "Tidak Ada Minuman Keras? Anda Dapat Kalah: Mengapa Peminum Menghasilkan Lebih Banyak Uang Daripada Bukan Peminum," Jurnal Tenaga Kerja Penelitian, Penerbit Transaksi, vol. 27 (3), halaman 411-421, Juni). Atau apakah orang yang mendapat lebih banyak uang minum lebih banyak karena mereka memiliki penghasilan yang lebih besar atau karena stres? Ini adalah makalah yang bagus untuk membahas berbagai alasan termasuk kesalahan pengukuran, bias respon, hubungan sebab akibat, dll.

Contoh endogenitas "mungkin": Persamaan Mincer menjelaskan pendapatan kayu gelondongan berdasarkan pendidikan, pengalaman, dan pengalaman yang dikuadratkan. Ada literatur panjang tentang topik ini. Ekonom tenaga kerja ingin memperkirakan hubungan kausal pendidikan dengan pendapatan, tetapi mungkin pendidikan bersifat endogen karena "kemampuan" dapat meningkatkan jumlah pendidikan yang dimiliki seseorang (dengan menurunkan biaya untuk memperolehnya) dan dapat menyebabkan peningkatan pendapatan, terlepas dari tingkat pendidikan. Solusi potensial untuk ini bisa menjadi variabel instrumental. Buku Angrist dan Pischke, Mostly Harmless Econometrics membahas hal ini dan mengaitkan berbagai topik dengan sangat detail dan jelas.

Contoh konyol lain yang tidak saya dukung adalah: - Jumlah televisi per kapita dan angka kematian. Jadi mari kita kirim TV ke negara-negara berkembang. Jelas keduanya bersifat endogen terhadap sesuatu seperti PDB. - Jumlah serangan hiu dan penjualan es krim. Keduanya mungkin bersifat endogen terhadap suhu?

Saya juga suka menceritakan lelucon mengerikan tentang orang gila dan labah-labah. Orang gila berkeliaran di koridor suaka dengan laba-laba yang dibawanya di telapak tangannya. Dia melihat dokter dan berkata, "Lihat Doc, aku bisa bicara dengan laba-laba. Lihat ini." Laba-laba, ke kiri! "Laba-laba itu bergerak ke kiri. Dia melanjutkan," Laba-laba, ke kanan. " kanan telapak tangannya. Dokter menjawab, "Menarik, mungkin kita harus membicarakan ini di sesi kelompok berikutnya." Orang gila balas, "Itu bukan apa-apa, Dok. Lihat ini. "Dia menarik setiap kaki laba-laba satu per satu dan kemudian berteriak," Laba-laba, belok kiri! "Laba-laba itu berbaring tak bergerak di telapak tangannya dan orang gila berpaling ke dokter dan menyimpulkan," Jika kamu melepaskan milik laba-laba kaki dia akan tuli. "


8

Yang terbaik yang pernah diajarkan kepada saya adalah jumlah tenggelam dan penjualan es krim mungkin sangat berkorelasi tetapi itu tidak menyiratkan satu menyebabkan yang lain. Tenggelam dan penjualan es krim jelas lebih tinggi di bulan-bulan musim panas ketika cuaca baik. Variabel ketiga alias cuaca yang baik menyebabkan mereka.


6

Sebagai generalisasi dari 'bajak laut yang menyebabkan pemanasan global': Pilih dua kuantitas yang (monotonik) meningkat atau menurun seiring waktu dan Anda akan melihat beberapa korelasinya.


6

Anda dapat menghabiskan beberapa menit di Google Correlate , dan menghasilkan semua jenis korelasi palsu.


1
Meskipun tautan ini dapat menjawab pertanyaan, lebih baik untuk memasukkan bagian-bagian penting dari jawaban di sini dan memberikan tautan untuk referensi. Jawaban hanya tautan dapat menjadi tidak valid jika halaman tertaut berubah.
gung - Reinstate Monica

1
@ung, apakah kamu serius? Tautannya adalah ke aplikasi, bukan ke halaman sederhana yang menjelaskan jawaban. Jawabannya akan menjadi tidak valid jika halaman tertaut berubah, karena alat tidak akan tersedia (dalam bentuk saat ini).
Jerome Baum

6

Saya bekerja dengan siswa dalam mengajar korelasi vs sebab-akibat di kelas Aljabar Satu saya. Kami memeriksa banyak contoh yang mungkin. Saya menemukan artikel Bayi Bundel dan Es Krim Berbahaya: Puzzler Korelasi dari Guru Matematika Februari 2013 bermanfaat. Saya suka ide berbicara tentang "variabel mengintai". Juga kartun ini adalah pembuka percakapan yang lucu:

masukkan deskripsi gambar di sini

Kami mengidentifikasi variabel independen dan dependen dalam kartun dan berbicara tentang apakah ini merupakan contoh penyebab, jika tidak mengapa tidak.


4

Saya membaca (dahulu kala) tentang contoh menarik tentang penurunan angka kelahiran (atau tingkat kesuburan jika Anda lebih suka ukuran itu) terutama di AS, dimulai pada awal 1960-an, saat pengujian senjata nuklir berada pada titik tertinggi sepanjang masa. (pada tahun 1961 bom nuklir terbesar yang pernah diledakkan diuji di Uni Soviet). Tarif terus melukis hingga akhir abad kedua puluh ketika sebagian besar negara akhirnya berhenti melakukan ini.

Saya tidak dapat menemukan referensi yang menggabungkan angka-angka ini sekarang, tetapi artikel Wikipedia ini memiliki angka angka uji senjata nuklir oleh negara.

Tentu saja, mungkin lebih masuk akal untuk melihat korelasi tingkat kelahiran dengan pengenalan dan legalisasi pil kontrasepsi 'secara kebetulan' dimulai pada awal 1960-an. (Hanya di beberapa negara bagian pertama, kemudian semua negara bagian untuk wanita yang sudah menikah saja, kemudian beberapa untuk yang belum menikah, kemudian di seluruh papan), Tetapi bahkan itu hanya bisa menjadi bagian dari penyebabnya; banyak aspek lain dari kesetaraan, perubahan ekonomi, dan faktor-faktor lain memainkan peran penting.


Contoh menarik, karena terlihat, pada pandangan pertama, seperti hubungan sebab dan akibat yang mungkin terjadi, tidak seperti banyak contoh paling konyol.
Bossykena

1
Yang saya sukai adalah Anda dapat memancing banyak diskusi tentang apakah "efek" itu benar-benar berdampak pada kesuburan (dalam pengertian medis tentang kemampuan untuk hamil) atau apakah itu bersifat sosial ("Saya tidak ingin membawa anak ke dalam situasi yang buruk ini). dunia"). Lalu jatuhkan bom tentang pil jika tidak ada orang lain yang membawanya. Dan kemudian tunjukkan bahwa bahkan ini hanya bisa menjadi salah satu faktor yang mungkin dan membahas beberapa yang lain.
AdamV

4

Korelasi dengan sendirinya tidak pernah dapat membangun hubungan sebab akibat. David Hume (1771-1776) berargumen dengan cukup efektif bahwa kita tidak dapat memperoleh pengetahuan tertentu tentang cauasality dengan cara empiris murni. Kant berusaha mengatasi ini, halaman Wikipedia untuk Kant tampaknya merangkumnya dengan cukup baik:

Kant percaya dirinya menciptakan kompromi antara kaum empiris dan kaum rasionalis. Kaum empiris meyakini bahwa pengetahuan diperoleh hanya melalui pengalaman, tetapi kaum rasionalis berpendapat bahwa pengetahuan semacam itu terbuka untuk keraguan Cartesian dan bahwa alasan sendiri memberi kita pengetahuan. Kant berpendapat, bahwa menggunakan akal tanpa menerapkannya pada pengalaman hanya akan mengarah pada ilusi, sementara pengalaman akan murni subjektif tanpa terlebih dahulu digolongkan di bawah alasan murni.

Dengan kata lain, Hume memberi tahu kita bahwa kita tidak akan pernah tahu hubungan kausal ada hanya dengan mengamati korelasi, tetapi Kant menyarankan bahwa kita mungkin dapat menggunakan alasan kita untuk membedakan antara korelasi yang menyiratkan hubungan kausal dari mereka yang tidak. Saya tidak berpikir Hume tidak akan setuju, selama Kant menulis dalam hal masuk akal daripada pengetahuan tertentu.

Singkatnya, korelasi menyediakan bukti tidak langsung yang menyiratkan hubungan sebab akibat, tetapi bobot bukti sangat bergantung pada keadaan tertentu yang terlibat, dan kita tidak pernah bisa benar-benar yakin. Kemampuan untuk memprediksi efek dari intervensi adalah salah satu cara untuk mendapatkan kepercayaan diri (kami tidak dapat membuktikan apa pun, tetapi kami dapat membantah dengan bukti pengamatan, jadi kami setidaknya telah mencoba untuk memalsukan teori hubungan sebab akibat). Memiliki model sederhana yang menjelaskan mengapa kita harus mengamati korelasi yang juga menjelaskan bentuk-bentuk bukti lain adalah cara lain kita dapat menerapkan penalaran kita seperti yang disarankan Kant.

Kaisar peringatan: Sangat mungkin saya telah salah memahami filosofi, namun tetap saja suatu korelasi tidak pernah bisa memberikan bukti adanya hubungan sebab akibat.


2
Untuk apa nilainya, dalam terminologi saat ini saya pikir orang harus membaca Kant sebagai pernyataan, misalnya dalam Analogi Kedua, bahwa apa pun korelasi yang Anda amati, ada beberapa grafik kausal yang menghasilkannya. Sejauh yang saya sadari dia tidak memiliki metode khusus untuk mengidentifikasi struktur tetapi memang berasumsi bahwa itu harus sepenuhnya terhubung (karena 'setiap kejadian memiliki penyebab'). Dalam pengertian ini ia kontemporer: inferensial kausal membutuhkan campuran asumsi-asumsi kausal, misalnya diekspresikan melalui grafik, dan keteraturan yang teramati dalam data. Dan Anda biasanya tidak dapat menghindari bagian pertama atau membujuknya dari data
conjugateprior

+1 dijelaskan dengan baik! Mungkin saya terlalu Bayesian, tetapi saya tidak terlalu terganggu dengan gagasan bahwa kita tidak dapat memiliki pengetahuan pasti tentang hubungan sebab akibat.
Dikran Marsupial



3

Hitungan sperma pada laki-laki di desa-desa di Slovenia dan jumlah beruang (juga di Slovenia) menunjukkan korelasi negatif. Beberapa orang merasa ini sangat mengkhawatirkan. Saya akan mencoba dan mendapatkan studi yang melakukan ini.


3

Saya baru-baru ini menghadiri konferensi dan salah satu pembicara memberikan contoh yang sangat menarik ini (walaupun intinya adalah untuk menggambarkan sesuatu yang lain):

  • Orang Amerika dan Inggris makan banyak makanan berlemak. Ada tingkat tinggi penyakit kardiovaskular di AS dan Inggris.

  • Orang Prancis makan banyak makanan berlemak, tetapi mereka memiliki tingkat penyakit kardiovaskular yang rendah.

  • Orang Amerika dan Inggris banyak minum alkohol. Ada tingkat tinggi penyakit kardiovaskular di AS dan Inggris.

  • Orang Italia banyak minum alkohol, tetapi sekali lagi, mereka memiliki tingkat penyakit kardiovaskular yang rendah.

Kesimpulannya? Makan dan minum apa yang Anda inginkan. Dan Anda memiliki peluang lebih tinggi terkena serangan jantung jika Anda berbicara bahasa Inggris!


3
Ini juga merupakan contoh yang baik tentang kekeliruan ekologis (yaitu, membuat kesimpulan tentang tingkat individu dari data tingkat kelompok).
Jeromy Anglim


3

Contoh lain dari korelasi yang saya gunakan adalah peningkatan besar dalam jumlah orang yang makan makanan organik dan peningkatan jumlah anak yang didiagnosis dengan autisme di AS. Ada grafik parodi di web - grafik parodi makanan organik autisme


3

http://tylervigen.com/

Ini menunjukkan satu ton korelasi yang jelas tidak ada hubungannya dengan sebab-akibat - Atau apakah Anda punya ide bagus apa yang menyebabkan korelasi Age of Miss America berkorelasi dengan Pembunuhan oleh uap, uap panas dan benda panas

??


2

Mengajarkan "Korelasi tidak berarti sebab-akibat" tidak benar-benar membantu siapa pun karena pada akhirnya semua argumen deduktif sebagian didasarkan pada korelasi.

Manusia sangat buruk dalam belajar untuk tidak melakukan sesuatu.

Tujuannya seharusnya konstruktif: Selalu pikirkan alternatif untuk asumsi awal Anda yang mungkin menghasilkan data yang sama.


1
Ini tidak menanggapi pertanyaan: mungkin itu harus dipahami sebagai komentar.
whuber

2

Nah Prof. saya menggunakan ini di kelas probabilitas Pendahuluan:

1) Ukuran sepatu berkorelasi dengan kemampuan membaca

2) Serangan hiu berkorelasi dengan penjualan es krim.


2

Semakin banyak pemadam kebakaran yang dikirim ke api, semakin besar kerusakannya.


1
Satu-satunya masalah dengan ini sebagai contoh adalah bahwa ada penyebab yang jelas terbalik.
naught101

1

Saya pikir paradigma yang lebih baik mungkin sebab-akibat memerlukan korelasi yang terkait dengan mekanisme yang kredibel dan lebih baik terbukti. Saya pikir kata menyiratkan harus digunakan sangat hemat dalam konteks ini, karena memiliki beberapa arti termasuk saran.


1

Contoh bangau ada di halaman 8 edisi pertama (1978) dari buku Box, Hunter & Hunter berjudul "Statistics for Experimenters ..." (Wiley). Saya tidak tahu apakah ini dalam edisi ke-2. Mereka mengidentifikasi kota sebagai Oldenburg dan periode waktu sebagai 1930-1936.

Mereka merujuk Ornithologische Monatsberichte , 44 , No 2, Jahrgang, 1936, Berlin, dan 48 , No 1, Jahrgang, 1940, Berlin, dan Statistiches Jahrbuch Deutscher Gemeinden , 27-33, 1932-1938, Gustav Fischer, Jena.


0

Saya melihat yang lucu di sebuah artikel.

Produksi mentega di Bangladesh memiliki salah satu korelasi tertinggi dengan S&P 500 selama sepuluh tahun.

http://www.forbes.com/sites/davidleinweber/2012/07/24/stupid-data-miner-tricks-quants-fooling-themselves-the-economic-indicator-in-your-pants/


2
Hah? Grafik menunjukkan S&P dari waktu ke waktu. Judulnya berbicara tentang produksi mentega dan keju, yang tidak terlihat pada grafik. ???
Harvey Motulsky


3
Oke, sekarang saya mengerti. Grafik menunjukkan prediksi model regresi berganda, yang menunjukkan bahwa memasukkan tiga variabel konyol melakukan pekerjaan yang cukup baik untuk membuat model memprediksi perubahan dalam SP500 seiring waktu. Ini adalah contoh yang baik dari overfitting dalam regresi berganda, dan secara tidak langsung menunjukkan bahwa korelasi (atau peningkatan good-of-fit model mewah) tidak menyiratkan sebab-akibat.
Harvey Motulsky

0

Ini yang sempurna. Dan sayangnya, ini dapat digunakan sebagai poin pengajaran yang bagus karena baik staf Washington Post maupun Pusat Pengendalian dan Pencegahan Penyakit tidak menunjukkan bukti pengetahuan bahwa artikel tersebut harus menjadi bagian sindiran dalam The Onion.

https://www.washingtonpost.com/health/trumps-presidency-may-be-making-latinos-sick/2019/07/19/4e89b9f0-a97f-11e9-9214-246e594de5d5_story.html?utm_term=.9dd329c2e837


3
Harap rangkum apa yang dikatakan di balik tautan, bukan hanya Anda menilai itu salah.
cbeleites

Maaf. Tapi saya pikir ini cukup jelas.
Mark C.

2
Tautan baik-baik saja sebagai referensi ke sumber, tetapi Anda tidak boleh berasumsi bahwa semua orang dapat benar-benar membacanya (atau tidak tanpa banyak kesulitan). Harap diingat: Tautan semacam itu sangat rentan terhadap tautan busuk, dan tidak semua surat kabar melayani semua wilayah geografis (mis. Ada surat kabar AS yang memutuskan bahwa kepatuhan terhadap EU GDPR tidak layak mengganggu dan yang pada gilirannya akan memblokir pembaca dengan IP IP alamat).
cbeleites

-2

Seseorang berkata, korelasi mungkin tidak berarti sebab-akibat tetapi pasti bisa menjadi petunjuk yang bagus :)

Ok kesampingkan bagian yang menyenangkan, apa sebenarnya penyebabnya? Apakah kita benar-benar yakin bahwa bajak laut tidak menyebabkan pemanasan global?

Kontra-intuitif, tetapi apa yang dianggap sebagai penyebab dan apa sebagai efek (dalam studi korelasi tidak begitu jelas). Tentu saja berkali-kali keduanya hanya bisa menjadi efek dari penyebab umum (dan dengan demikian berkorelasi)

Semuanya bermuara pada metode penentuan sebab-akibat.

Ini adalah penyebab (pun intended) perkataan:

Ada kebohongan kecil. Ada kebohongan besar dan ada statistik.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.