Hubungan antara korelasi dan sebab-akibat


19

Dari halaman Wikipedia yang berjudul korelasi tidak menyiratkan hubungan sebab akibat ,

Untuk dua peristiwa berkorelasi, A dan B, hubungan yang mungkin berbeda meliputi:

  1. A menyebabkan B (penyebab langsung);
  2. B menyebabkan A (penyebab terbalik);
  3. A dan B adalah konsekuensi dari penyebab umum, tetapi tidak menyebabkan satu sama lain;
  4. A dan B keduanya menyebabkan C, yang (secara eksplisit atau implisit) dikondisikan pada;
  5. A menyebabkan B dan B menyebabkan A (penyebab dua arah atau siklik);
  6. A menyebabkan C yang menyebabkan B (penyebab tidak langsung);
  7. Tidak ada koneksi antara A dan B; korelasinya adalah suatu kebetulan.

Apa maksud poin keempat. A dan B keduanya menyebabkan C, yang (secara eksplisit atau implisit) dikondisikan. Jika A dan B menyebabkan C, mengapa A dan B harus dikorelasikan.


8
Wajib yang terkait xkcd: xkcd.com/552
Todd Wilcox

2
Meskipun ada pepatah yang saya harapkan ada korelasi tinggi antara korelasi dan sebab-akibat ...
Mehrdad


Jawaban:


18

"Pengkondisian" adalah kata dari teori probabilitas: https://en.wikipedia.org/wiki/Conditional_probability

Pengkondisian pada C berarti bahwa kita hanya melihat kasus di mana C benar. "Secara implisit" berarti bahwa kita mungkin tidak membuat batasan ini eksplisit, kadang-kadang bahkan tidak sadar melakukannya.

Maksudnya adalah bahwa, ketika A dan B keduanya menyebabkan C, mengamati korelasi antara A dan B dalam kasus di mana C benar, tidak berarti ada hubungan nyata antara A dan B. Hanya pengkondisian pada C (mungkin dengan enggan) yang menciptakan korelasi buatan.

Mari kita ambil contoh.

Di suatu negara ada persis dua jenis penyakit, independen sempurna. Panggilan A: "orang memiliki penyakit pertama", B: "orang memiliki penyakit kedua". Asumsikan , P ( B ) = 0,1 .P(A)=0.1P(B)=0.1

Sekarang setiap orang yang memiliki salah satu dari penyakit ini pergi ke dokter dan baru setelah itu. Panggil C: "orang pergi ke dokter". Kami memiliki .C=A or B

Sekarang mari kita hitung beberapa probabilitas:

  • P(C)=0.19
  • P(A|C)=P(B|C)=0.10.190.53
  • P(A and B|C)=0.010.190.053
  • P(A|C)P(B|C)0.28

Jelas, ketika dikondisikan pada C, dan B sangat jauh dari independen. Sebenarnya, dikondisikan pada C, n o t A tampaknya "menyebabkan" B .ABnotAB

AB


13

Poin keempat adalah contoh paradoks Berkson , yang juga dikenal sebagai pengkondisian pada collider , yang juga dikenal sebagai fenomena yang menjelaskan menjauh .

AttractiveAcceptCharming
AttractiveCharmingAccept

AttractiveCharmingAccept=1. Sekarang seandainya saya memberi tahu Anda tentang seorang pria yang wanita itu setujui untuk berkencan, dan saya beri tahu Anda bahwa dia (menurut wanita itu) sama sekali tidak menarik. Yah, kita tahu bahwa wanita itu setuju untuk berkencan dengannya, jadi kita dapat menyimpulkan bahwa dia memang sangat menawan. Sebaliknya, jika kita mengetahui tentang seorang pria yang lamaran lamarannya diterima dan yang tidak menawan, kita dapat menyimpulkan bahwa dia pasti cukup menarik.

Accept=1AttractiveCharmingAccept


5

Paradoks Simpson dan paradoks Berkson masing-masing dapat memberikan contoh "A dan B keduanya menyebabkan C, yang (secara eksplisit atau implisit) dikondisikan pada"

100010010%20020%20

28020%100%


Ini adalah contoh paradoks Berkson, bukan paradoks Simpson (lihat jawaban saya).
Jake Westfall

@JakeWestfall Anda mungkin benar - saya tahu saya telah menulis contoh perangko sebelumnya di suatu tempat tetapi lupa di mana dan ternyata itu halaman Wikipedia untuk paradoks Berkson
Henry

4

Paragraf dimulai dengan "Untuk setiap dua peristiwa berkorelasi, A dan B, ...", jadi tebakan saya adalah bahwa korelasi diasumsikan pada awalnya. Dengan kata lain, mereka tidak perlu dikorelasikan untuk secara bersamaan menyebabkan C, tetapi jika mereka dikorelasikan dan mereka berdua menyebabkan C, itu tidak menyiratkan bahwa ada hubungan sebab akibat di antara mereka.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.