Korelasi tidak berarti sebab-akibat; tetapi bagaimana dengan ketika salah satu variabel adalah waktu?


41

Saya tahu pertanyaan ini telah ditanyakan satu miliar kali, jadi, setelah mencari online, saya sepenuhnya yakin bahwa korelasi antara 2 variabel tidak menyiratkan sebab-akibat. Dalam salah satu kuliah statistik saya hari ini, kami mendapat kuliah tamu dari seorang ahli fisika, tentang pentingnya metode statistik dalam fisika. Dia mengatakan pernyataan yang mengejutkan:

korelasi tidak menyiratkan sebab-akibat, KECUALI salah satu variabel adalah waktu. Jadi, jika ada korelasi kuat antara beberapa variabel independen dan waktu, maka ini menyiratkan sebab-akibat juga.

Saya belum pernah mendengar pernyataan ini sebelumnya. Apakah fisikawan / relativis melihat "Sebab-akibat" berbeda dari statistik orang?


12
Ini adalah pernyataan yang tidak jelas, dan mungkin tidak benar. Waktu tidak menyebabkan banyak hal kecuali peluruhan radioaktif. Kosakata cenderung meningkat seiring bertambahnya usia tetapi dimediasi sepenuhnya oleh sosialisasi dan pendidikan. Bisakah Anda menggambarkan konteks dan masalah di mana pernyataan ini dinyatakan?
AdamO

@ AdamO Kondisi untuk kausalitas lebih sederhana ketika Anda tahu prioritas temporal, tetapi mereka tidak sesederhana dalam pertanyaan ini.
Neil G

2
Hampir terdengar seperti mereka menggambarkan kausalitas Granger .
Barker

1
Hanya mencatat bahwa jika Anda benar-benar ingin tahu bagaimana fisikawan melihat hubungan sebab akibat, Anda lebih mungkin mendapatkan jawaban itu pada Fisika . Versi modifikasi dari pertanyaan ini bisa mengenai topik di sana.
David Z

2
Saya pernah mendengar bahwa menambahkan waktu ke model sebagai variabel independen hanya berarti Anda tidak menghabiskan banyak waktu untuk membuat model proses pembuatan data yang menghasilkan variabel dependen Anda.
Alexis

Jawaban:


37

Saya akan memberikan jawaban lain, karena saya pikir yang saat ini disediakan kehilangan poin penting dari pernyataan yang dibuat fisikawan. Pernyataan yang dikutip adalah:

"Korelasi tidak menyiratkan sebab-akibat, KECUALI salah satu variabel adalah waktu. Jadi, jika ada korelasi kuat antara beberapa variabel independen dan waktu, maka ini juga menyiratkan sebab-akibat."

Fisikawan tidak mengatakan:

"Jika X dan Y berkorelasi, dan X datang sebelum Y, maka korelasi menyiratkan sebab-akibat."

Itu tidak benar. Apa fisikawan yang katakan adalah:

"Jika X dan waktu berkorelasi, maka korelasi itu menyiratkan bahwa peningkatan waktu menyebabkan peningkatan (atau penurunan) pada X."

Contohnya mungkin entropi. Jika kita memiliki korelasi yang kuat antara berlalunya waktu dan peningkatan entropi, maka kita dapat mengatakan bahwa peningkatan waktu menyebabkan peningkatan entropi. Perhatikan bahwa ini mengabaikan apa penyebab fisik dari peningkatan entropi (pembusukan partikel, perluasan semesta, dll.).

Salah satu persyaratan tradisional untuk sebab-akibat adalah perkembangan waktu, yaitu bahwa X hanya dapat menyebabkan Y jika X datang sebelum Y. Tetapi jika salah satu variabel Anda ADALAH waktu, maka perkembangan waktu sudah tertanam dalam hubungan (jika ada hubungan).

EDIT: Berdasarkan berbagai komentar, saya akan menambahkan yang berikut ini. Saya pikir fisikawan itu mungkin menggunakan ide berbeda dari kata "sebab-akibat" di sini. Dia tampaknya mengatakan bahwa jika ada korelasi antara variabel independen dan waktu, Anda dapat menyimpulkan bahwa variabel independen berubah sesuai prediksi seiring berjalannya waktu. Beberapa orang mungkin mengatakan perubahan itu "disebabkan" oleh berlalunya waktu, ini bukan cara para ahli statistik menggunakan kata-kata "penyebab" atau "sebab-akibat", sehingga mungkin menyebabkan beberapa kebingungan.


3
+1 Persis, itulah cara saya mengartikan pernyataan itu juga (lihat komentar & jawaban saya sebelumnya)
Ruben van Bergen

5
Jika Anda akan menjadikan waktu sebagai variabel dalam model grafis Anda, maka waktu tidak memiliki penyebab dan penyebab semuanya. Oleh karena itu klaim yang kosong menyatakan bahwa waktu menyebabkan sesuatu yang khusus karena waktu menyebabkan segalanya.
Neil G

2
Kosong atau tidak, ini adalah interpretasi yang tampaknya konsisten dengan apa yang dikatakan fisikawan itu. Jangan tembak pengirim pesan;). Juga, saya pikir itu adalah suatu hal yang layak dibuat jika tujuannya adalah untuk mendidik orang tentang hubungan antara korelasi dan sebab-akibat, bahkan jika Anda pikir itu sepele untuk benar-benar mempertimbangkan waktu yang menyebabkan hal-hal dalam praktek.
Ruben van Bergen

6
@ GeoMatt22 - Saya tidak setuju dengan ide "waktu yang menyebabkan segalanya". Pertimbangkan untuk membalik koin berkali-kali - bahkan jika saya membalik selama berjam-jam, saya masih harus mendapatkan sekitar 1/2 rasio kepala, jadi waktu tidak "menyebabkan" kemungkinan kepala naik atau turun. Letakkan es batu di ruangan dan suhunya akan naik dan akan meleleh seiring waktu - waktu "menyebabkan" keseimbangan suhu dalam kasus ini. Ini mungkin pengertian yang berbeda dari kata "penyebab" yang digunakan para ahli statistik, tetapi saya pikir ini adalah interpretasi fungsional dari perspektif fisika.
Duncan

6
Intinya adalah bahwa Anda tidak akan pernah mempertimbangkan struktur grafis di mana variabel apa pun menyebabkan berlalunya waktu. Oleh karena itu satu-satunya struktur grafis adalah waktu adalah penyebab dari semua variabel lainnya. Ini mungkin sama sekali tidak memiliki pengaruh pada mereka (seperti dalam contoh Anda), tetapi panah sebab akibat adalah klaim tentang struktur grafis kausal, yang menyiratkan hubungan independensi bersyarat diberikan pengamatan dan intervensi . Kekuatan pengaruh adalah pertanyaan terpisah.
Neil G

15

Kami tidak tahu apa yang dimaksud fisikawan itu. Dua interpretasi berbeda mengikuti.


Klaim bahwa mendahului Y dan dihubungkan dengan Y menyiratkan bahwa X menyebabkan Y salah. Ini tidak cukup untuk X dan Y menjadi tergantung bahkan jika X mendahului Y . Misalnya, X dan Y keduanya dapat disebabkan oleh beberapa variabel lain W : X W Y . Atau, pola yang lebih rumit dapat muncul: X V Z W Y di mana ZXYYXYXYXYXYWXWYXVZWYZdiamati. Sekarang dan Y tergantung dan tidak memiliki penyebab yang sama, tetapi tidak ada yang menyebabkan yang lain.XY

Namun, prioritas temporal sangat menyederhanakan kondisi untuk menyatakan hubungan sebab akibat, yang dapat Anda temukan dalam buku Kausalitas Pearl Bab 2.7 "Kriteria lokal untuk hubungan sebab akibat".

Variabel memiliki pengaruh kausal pada Y jika ada variabel ketiga Z dan konteks S , keduanya terjadi sebelum X , sehingga:XYZSX

  1. ;(Z⊥̸YS)
  2. (ZYSX)

Pada dasarnya, (1) menyiratkan bahwa adalah penyebab potensial Y mengingat prioritas temporal, dan (2) menyiratkan bahwa X mampu memutuskan hubungan itu, yang hanya dapat terjadi jika X menyebabkan YZYXXY .

Kondisi ini jauh lebih sederhana daripada definisi Pearl untuk tujuan asli tanpa informasi sementara.


Kemungkinan lain diuraikan dalam beberapa jawaban yang lain adalah bahwa fisikawan berarti bahwa jika adalah berlalunya waktu dan itu berkorelasi dengan Y , maka X menyebabkan Y . Pernyataan ini benar, tetapi kosong karena berlalunya waktu adalah penyebab dari semua variabel lain, yang saya maksudkan bahwa struktur grafis kausal adalah seperti ini. Struktur grafis kausal adalah seperangkat klaim tentang hubungan kemandirian yang diberikan pengamatan dan intervensi.XYXY


2
Seperti yang saya sebutkan di komentar untuk jawaban GeoMatt22, saya tidak berpikir pernyataan fisikawan itu ada hubungannya dengan didahulukan.
Ruben van Bergen

2
@RubenvanBergen Seperti yang saya jelaskan di jawaban lain, interpretasi itu kosong. Waktu menyebabkan segalanya.
Neil G

Dalam contoh Anda , X dan Y akan tergantung, tetapi tidak berkorelasi (kecuali V dan W dikorelasikan melalui koneksi yang tidak Anda tentukan). XVZWYXYVW
Ruben van Bergen

@RubenvanBergen Mereka bisa dikorelasikan. Itu tergantung pada sifat ketergantungannya. By the way, saya katakan dan Y tergantung mengingat Z diamati. XYZ
Neil G

1
@ RubenvanBergen Saya pikir Anda salah paham panah. Ini adalah panah kausal, dan informasi dapat mengalir dari ke W karena menjelaskan jauh di Z . Anggaplah V adalah "Hujan", W adalah "Penyiram mati", Z adalah tanah basah, X adalah suara hujan, dan Y adalah indikator untuk penyiram sprinkler mati. Sekarang mengingat bahwa tanah basah, X berkorelasi dengan Y karena menjelaskan. VWZVWZXYXY
Neil G

10

Saya berspekulasi bahwa dosen tamu Anda berarti bahwa dalam fisika satu-satunya korelasi yang bertahan replikasi adalah yang ada di mana ada hubungan sebab akibat yang mendasarinya. Variabel waktu adalah pengecualian karena itu adalah satu-satunya variabel yang tidak dikendalikan oleh fisikawan. Inilah sebabnya.

Dalam fisika kita biasanya berurusan dengan fenomena dan eksperimen yang berulang. Sebagai soal fakta, hampir setiap percobaan dapat diulang, dan dapat direplikasi oleh Anda di lain waktu atau oleh peneliti lain. Jadi, katakanlah Anda mengamati sampel di mana adalah pengamatan dari variabel minat dan variabel independen x k . Seperti yang saya sebutkan di atas kami sepenuhnya mengontrol variabel x kyi,xkixkxk , dan dapat mengatur mereka untuk nilai apapun yang kita inginkan.

Pria fisikawan Anda mengatakan bahwa dalam pengaturan ini Anda tidak akan melihat korelasi kecuali ada tautan sebab-akibat. Mengapa? Karena orang lain atau bahkan Anda sendiri akan mengulangi percobaan dengan kombinasi dan urutan x k j , dan hanya korelasi dengan hubungan kausal akan bertahan ulangan dari sebuah eksperimen. Semua korelasi (palsu) lainnya akan hilang setelah Anda mengumpulkan data yang cukup dalam semua kemungkinan kombinasi percobaan.Corr[y,xk]xkj

Situasi ini sangat kontras dengan ilmu sosial dan beberapa aplikasi bisnis di mana Anda tidak dapat melakukan eksperimen. Anda hanya mengamati satu urutan PDB suatu negara, dan tidak dapat mengubah tingkat pengangguran yang menyamakan semua dan mengamati korelasinya.

Sekarang, waktu adalah satu-satunya variabel yang tidak dapat dikontrol oleh fisikawan. Hanya ada satu Jan 1 2017. Dia tidak bisa mengulangi hari ini. Dia dapat mengulangi variabel lain apa pun, tetapi tidak waktu. Itu sebabnya ketika datang ke waktu ( bukan waktu atau usia murtad), seorang fisikawan berada di kapal yang sama dengan orang lain: korelasi tidak menyiratkan sebab-akibat baginya.


5

Saya belum pernah mendengar ini sebelumnya, dan itu tidak akan benar sesuai dengan konsepsi kausalitas yang saya kenal (meskipun saya bukan seorang ahli fisika).

Biasanya, untuk penyebabnya Y itu diperlukan bahwa X mendahului Y dalam waktu. Jadi, jika Y mendahului X maka itu tidak dapat "disebabkan" oleh X , terlepas dari korelasi apa pun. Selain itu, X sebelum Y bukanlah kondisi yang cukup untuk penyebab (juga terlepas dari korelasi apa pun).XYXYYXXXY


1
Saya pikir Anda salah paham apa yang dimaksud fisikawan ini. Saya pikir mereka mengacu pada situasi di mana dua variabel berkorelasi satu sama lain, dan salah satu dari variabel ini adalah waktu. Anda mengasumsikan bahwa tidak ada variabel yang merupakan waktu, tetapi ketika waktu muncul adalah salah satu variabel mendahului variabel lainnya.
Ruben van Bergen

3
Saya mencoba untuk menunjukkan bahwa perjalanan waktu biasanya diperlukan untuk beberapa perubahan dalam menjadi "disebabkan" oleh sesuatu, tetapi korelasiY vs t tidak biasanya disebut sebagai "kausalitas" (a Δ t diperlukan tapi tidak cukup). Saya bermaksud untuk berkomunikasi bahwa sayatidak tahuapakah ini yang dimaksud oleh fisikawan atau tidak. Saya membayangkan seorang fisikawan biasanya akan mengatakan "penurunan karbon 14 melalui waktu disebabkan olehpeluruhan radioaktif)" daripada "... disebabkan oleh berlalunya waktu". (Meskipun mungkin "membutuhkanperjalanan waktu".)YttΔt
GeoMatt22

@RubenvanBergen mungkin dosen itu sedang berusaha mengekspresikan versi yang disederhanakan dari sesuatu yang oleh Wikipedia disebut sebagai " struktur sebab akibat "? Korelasi dengan waktu (pada skala yang cukup baik) akan menyiratkan diferensiabilitas dalam "waktu seperti arah". Saya mungkin salah membaca, tetapi membaca sekilas Wikipedia menyarankan penggunaan yang mirip dengan apa yang saya tulis di atas: "struktur sebab akibat" mendefinisikan apa yang "mendahului" artinya. Tapi sepertinya "perlu tetapi tidak cukup" bagi saya.
GeoMatt22

Saya hanya akan mengikuti kutipan dalam pertanyaan: "korelasi tidak menyiratkan sebab-akibat, KECUALI salah satu variabel adalah waktu. Jadi, jika ada korelasi yang kuat antara beberapa variabel independen dan waktu, maka ini juga menyiratkan sebab-akibat." Bagi saya ini menyiratkan bahwa kita memiliki beberapa variabel X yang berkorelasi dengan waktu. Kami menyimpulkan bahwa perjalanan waktu menyebabkan X, daripada X yang menyebabkan perjalanan waktu, karena yang terakhir tidak masuk akal.
Ruben van Bergen

4

Saya tidak berpikir waktu harus unik dalam hal ini, tetapi tentu saja ini contoh yang baik. Intinya adalah bahwa biasanya jika A & B berkorelasi, Anda dapat menduga bahwa ada beberapa kausalitas umum, tetapi Anda tidak tahu apakah A menyebabkan B atau B menyebabkan A, atau mungkin variabel ketiga C menyebabkan A & B. Namun, , dalam kasus-kasus tertentu, Anda dapat mengesampingkan bahwa variabel lain mana pun yang menyebabkan A, dan itu pasti karena A yang menyebabkan B. Salah satu contohnya adalah eksperimen terkontrol, di mana Anda , eksperimen, kontrol A. Kemudian jika perubahan yang Anda buat dalam A "berkorelasi" dengan perubahan B, Anda tahu itu pasti A yang menyebabkan B berubah, bukan sebaliknya.

Jenis skenario lain, yang merupakan salah satu contoh dengan waktu ini, adalah jika Anda hanya tahu bahwa tidak ada variabel lain yang dapat menyebabkan A karena Anda tahu bahwa tidak ada hal apa pun yang dapat memengaruhi A. Karena waktu hanya mengalir satu detik pada satu waktu tanpa peduli dari variabel lain mana pun di dunia, maka jika waktu berkorelasi dengan perubahan dalam beberapa variabel yang Anda minati (katakanlah, jumlah orang di planet ini), Anda tahu pasti bahwa perjalanan waktu pasti menyebabkan variabel tersebut berubah, alih-alih daripada variabel Anda yang menyebabkan waktu berlalu atau berubah (yaitu waktu tidak berjalan karena lebih banyak orang dilahirkan, itu harus sebaliknya).

Apa yang masih belum Anda ketahui, tentu saja, adalah apakah kausalitas itu langsung. Agaknya perjalanan waktu itu sendiri tidak secara otomatis menghasilkan lebih banyak manusia. Melainkan, sejarah yang terbuka menyebabkan kemajuan dalam berbagai aspek masyarakat, dan ini menyebabkan populasi bertambah besar (dan bahkan itu adalah penyederhanaan dari banyak hubungan kausatif kecil). Tetapi terlepas dari faktor-faktor yang berperan, Anda tentu tahu bahwa A (akhirnya) mengarah ke B dan bukan sebaliknya.


Di paragraf pertama Anda, tiga kasing Anda tidak lengkap. Ada struktur grafis lain yang kompatibel dengan korelasi.
Neil G

Mengesampingkan semua variabel lain yang menyebabkan tidak mungkin untuk masalah yang realistis. Ada metode di mana Anda mengesampingkan aliran informasi melalui penyebab ASEBUAHSEBUAHB

1
Seperti yang saya katakan dalam jawaban lain, gagasan menafsirkan "berlalunya waktu" sebagai variabel dan mengklaim bahwa itu harus menjadi penyebab beberapa variabel lain kosong. Variabel waktu ini adalah penyebab segalanya.
Neil G

Secara umum, saya cukup yakin opsi yang saya daftarkan adalah semua kemungkinan. Kita dapat memiliki A menyebabkan B atau B menyebabkan A (langsung atau tidak langsung), atau kita dapat memiliki sesuatu yang menyebabkan A & B. Tentu saja kombinasi ini juga dimungkinkan, di mana misalnya A memiliki beberapa efek kausal pada B, tetapi pada saat yang sama faktor ketiga C juga secara kausal mempengaruhi kedua A & B. Dan kemudian saya kira ada kebetulan sebagai pilihan lain, tapi itu membosankan. Tapi saya ingin tahu mengetahui kemungkinan lain.
Ruben van Bergen

1
Lihatlah jawaban saya. Saya mengilustrasikan kasus keempat, meskipun ada lebih banyak kasus.
Neil G

4

Sebenarnya, korelasi memang menyiratkan hubungan kausal.

Mungkin A menyebabkan B, atau C menyebabkan A dan B.

Namun, korelasi tidak membuktikan sebab akibat.

Ini terbukti dengan sendirinya.


5
Pandangan di sekitar jawaban dan komentar menunjukkan percakapan di sini telah melampaui hal-hal sepele seperti itu. Saya merekomendasikan meninjau beberapa posting sebagai bantuan untuk menghargai masalah.
whuber

3

Saya akan menafsirkan ini sebagai argumen semantik daripada matematika / statistik. Saya juga akan menganggapnya sebagai generalisasi yang agak parah.

Itu Bradford Bukit Kriteria , sering digunakan dalam epidemiologi, menyediakan kerangka kerja yang baik untuk berpikir tentang sebab-akibat. Tidak ada yang dapat membuktikan sebab akibat secara pasti, apakah waktu adalah faktor atau tidak, dan saya curiga dosen itu tidak berusaha membuat pernyataan yang kuat. Namun, banyak faktor berbeda dapat digunakan sebagai argumen yang masuk akal untuk sebab-akibat.

Sebagai contoh, kriteria Bradford Hill menunjukkan bahwa kekuatan hubungan antara variabel dapat memberikan bukti untuk penyebab, tetapi tidak dengan sendirinya cukup. Demikian pula, asosiasi yang konsisten dengan fakta-fakta lain yang diketahui / dipercayai mungkin menyarankan sebab-akibat lebih kuat daripada asosiasi yang tidak konsisten dengan pengetahuan yang ada. Temporalitas juga merupakan salah satu kriteria - sebab harus mendahului efeknya. Suatu asosiasi, dan kesimpulan yang kita buat tentang sebab akibat, harus masuk akal secara temporal. Saya merekomendasikan meninjau kriteria lain. Beberapa khusus untuk epidemiologi dan tidak berlaku untuk fisika tetapi masih merupakan cara berpikir yang berguna.

Poin utamanya adalah bahwa, sementara tidak ada satu pun bukti yang akan membuktikan sebab-akibat secara definitif, Anda dapat membuat kasus yang bagus untuk itu berdasarkan pada sejumlah pemeriksaan logis yang berbeda. Saya berpendapat bahwa memberikan prioritas mutlak pada salah satu kriteria, seperti waktu, tidak tepat, tetapi temporalitas dapat menjadi faktor penting ketika membuat kasus bahwa sebab-akibat masuk akal.

Ini mengarah ke titik yang lebih luas tentang statistik: secara umum, kami menggunakan statistik untuk membuat argumen. Kami menggunakan data dan alat statistik untuk membuat poin tertentu. Seringkali, data yang sama (dan bahkan alat yang sama) dapat digunakan untuk membuat poin yang bertentangan. Kami tidak dapat menemukan bukti pasti penyebab dalam matematika itu sendiri, tetapi kami dapat menggunakan alat statistik kami sebagai bagian dari argumen yang lebih luas. Untuk lebih lanjut tentang itu, saya merekomendasikan Statistik Abelson sebagai Argumen Berprinsip.

Untuk mengulang ini kembali ke situasi semula, katakanlah Anda telah melakukan percobaan tentang efek konsentrasi bahan kimia tertentu dalam larutan pada suhu larutan itu. Anda menduga bahwa menambahkan lebih banyak bahan kimia ini akan menghasilkan reaksi yang meningkatkan suhu. Anda menambahkan lebih banyak dari waktu ke waktu. Anda dapat melihat suhu terhadap waktu dan melihat peningkatan. Semua ini menunjukkan bahwa suhu meningkat seiring waktu; itu tidak membuktikan bahwa waktu itu sendiri (atau apa pun, dalam hal ini) memiliki efek kausal. Namun, hal itu memberikan beberapa bukti dalam argumen yang lebih luas bahwa peningkatan konsentrasi bahan kimia ini menghasilkan reaksi yang meningkatkan suhu.


Ini pemikiran yang aneh untuk menerapkan kriteria Hill "temporal presedence" pada pemaparan waktu itu sendiri. Tentunya waktu mendahului waktu itu sendiri. Tren seperti yang kita tahu jarang bersifat kausal tetapi mencerminkan fenomena simultan lainnya . Dalam contoh ini, saya tidak berpikir waktu menyebabkan apa-apa, tetapi meringkas perubahan global dalam pengaturan yang kebetulan mempengaruhi paparan dan hasil.
AdamO

Saya tidak berpendapat bahwa kita menerapkan argumen pada waktu itu sendiri seperti mengatakan bahwa, jika kita memiliki waktu sebagai bagian dari data kita, kita dapat menggunakannya untuk membuat satu bagian dari argumen yang lebih luas untuk sebab-akibat. Dengan menunjukkan bahwa pengamatan kita masuk akal secara temporal, kita semakin dekat dengan argumen sebab akibat yang masuk akal. Mudah-mudahan, kita akan memiliki lebih dari itu untuk bekerja dalam rangka menciptakan argumen yang lebih kuat.
djlid

3

Kalimat ini cukup sederhana dan tidak layak untuk dipikirkan ulang (dan tidak ada hubungannya dengan prioritas).

Jika ada didirikan korelasi antara variabel dan waktu (yaitu kita tahu bahwa peningkatan waktu yang disertai dengan peningkatan variabel, dan ini adalah diberikan ), maka kita tahu "kausal" arah: yaitu waktu meningkat, penyebab variabel meningkat.

Karena hipotesis alternatif "nah-uh, bisa jadi waktu hanya meningkat karena variabel meningkat pertama " tidak bisa bertahan mengingat cara waktu bekerja.


Ini mungkin terdengar seperti pengamatan konyol, tetapi memiliki implikasi penting bagi desain penelitian yang mencoba membuktikan arah kausal. Contoh penting dalam kedokteran adalah perbedaan antara melakukan studi cross-sectional dan kohort.

Misalnya, penelitian lintas seksi yang mencoba menemukan hubungan antara merokok dan kanker mungkin mengambil sekelompok orang, membaginya menjadi perokok vs bukan perokok, dan melihat berapa banyak di setiap kelompok yang menderita kanker vs tidak kanker. Namun, ini adalah bukti yang lemah karena korelasi antara merokok dan kanker juga dapat diartikan sebagai "orang yang menderita kanker lebih mungkin menikmati merokok."

Namun, jika Anda melakukan studi kohort, yaitu mengambil sekelompok perokok dan sekelompok non-perokok, dan menindaklanjuti mereka melalui waktu, dan mengukur variabel "kanker pada perokok dikurangi kanker pada non-perokok", dan membangun positif korelasi variabel ini dengan waktu, (di bawah asumsi yang masuk akal, sehingga jumlah merokok setelah dimulai adalah konstan dan tidak tergantung waktu, dll) maka Anda tahu bahwa "waktu" adalah penyebab perbedaan kanker, karena Anda tidak dapat mengklaim bahwa peningkatan angka kanker menyebabkan waktu untuk lulus lebih banyak dalam kelompok merokok. Oleh karena itu Anda dapat mengklaim penyebab antara berlalunya waktu dan perbedaan kanker positif terkait dengan tingkat yang lebih tinggi pada kelompok perokok. (atau, lebih tepatnya dinyatakan, waktu yang dihabiskan milik kelompok merokok menyebabkan peningkatan risiko kanker secara proporsional).

Lebih lanjut, kelemahan dari studi cross-sectional, yaitu kemungkinan bahwa "orang dengan kanker lebih mungkin untuk berhenti merokok" sekarang telah keluar dari jendela, karena merokok sebagai variabel telah diambil dari "waktu vs kanker" persamaan (di sini diasumsikan konstan dan karena itu tidak terpengaruh oleh waktu). Dengan kata lain, dengan merumuskan penelitian dengan cara ini, kami telah memeriksa arah sebab akibat yang sangat spesifik . Jika kita ingin memeriksa sejauh mana arah kausal terbalik berlaku (yaitu seberapa besar kemungkinan orang yang pada akhirnya akan terkena kanker akan berhenti merokok seiring berjalannya waktu), maka kita harus merancang sebuah studi kohort yang dipecah menjadi "kanker masa depan vs kanker yang tidak ada masa depan" dan mengukur penggunaan rokok dari waktu ke waktu.

Perbarui menanggapi komentar:

Perhatikan bahwa ini adalah diskusi tentang arah sebab akibat dan bukan salah satu dari menemukan hubungan sebab akibat langsung. Pertanyaan perancu adalah pertanyaan yang terpisah. (Yaitu tidak ada yang menunjukkan bahwa tidak ada variabel ketiga independen yang keduanya membuat Anda lebih mungkin menjadi perokok dan meningkatkan peluang Anda terkena kanker seiring waktu). Yaitu, dalam hal kausalitas kontrafaktual, kami belum secara definitif menunjukkan bahwa "jika bukan karena merokok orang-orang ini tidak akan terkena kanker". Tetapi kami punyamenunjukkan bahwa "hubungan antara kelompok merokok dan kanker tidak akan meningkat jika waktu tidak berlalu". (Yaitu asosiasi tidak sampai ke snapshot penderita kanker preferensi semata-mata untuk berada di kelompok merokok atau tidak, tetapi diperkuat dari waktu ke waktu).


4
"Karena itu, Anda dapat mengklaim sebab-akibat antara waktu yang berlalu dan lebih banyak kanker yang berkembang karena menjadi perokok. (Atau, lebih tepatnya, waktu yang dihabiskan untuk merokok menyebabkan peningkatan risiko kanker secara proporsional)." - Tidak, kamu tidak bisa melakukan itu. Perusahaan-perusahaan rokok yang didukung oleh Sir Ronald Fisher (!) Berpendapat selama bertahun-tahun bahwa kecenderungan genetik adalah penyebab umum yang umum dari merokok dan kanker. Contoh ini ada di bagian belakang buku Pearl (hlm. 353).
Neil G

@NeilG tidak, saya mendukung contoh saya seperti yang dirumuskan. Poin yang Anda sampaikan bukan tentang kausalitas terbalik, tetapi membingungkan. Contoh saya, sebagaimana adanya, menunjukkan bahwa waktu yang dihabiskan dalam kelompok merokok dikaitkan dengan peningkatan tingkat kanker. Namun ini sendiri tidak membuktikan bahwa "kecenderungan genetik" bukanlah kekuatan pendorong di balik peningkatan angka dalam kelompok merokok. Dua hal berbeda. Intinya di sini adalah bahwa memperkenalkan arah kausal sebagai variabel waktu menghapus argumen "kausalitas terbalik" (yaitu kanker membuat Anda mulai merokok), tetapi bukan yang "membingungkan".
Tasos Papastylianou

1
Komentar Anda benar, tetapi tampaknya tidak konsisten dengan apa yang Anda tulis. Anda menulis bahwa "menghabiskan waktu merokok menyebabkan peningkatan risiko kanker secara proporsional". Itu tidak bisa dibenarkan.
Neil G

1
@ NeilG cukup adil, Anda benar. Saya tidak mengharapkan pengawasan seperti itu, hahah. Saya akan ulangi sedikit lebih akurat.
Tasos Papastylianou

Mengapa harus demikian halnya bahwa kemajuan waktu tidak masuk akal? Bagaimana kita bisa secara konklusif mengesampingkan kemungkinan bahwa ada sesuatu yang menyebabkan waktu untuk maju? Bagi saya itu adalah klaim paling luar biasa yang akan membutuhkan bukti yang sangat kuat.
David Schwartz

3

Ini benar-benar sebuah pertanyaan tentang bagaimana membangun kausalitas, karena peristiwa-peristiwa yang terkait tetapi tidak kausatif cenderung berkorelasi dalam ruang atau waktu. Jadi melihat beberapa data yang berkorelasi, bagaimana kita bisa menentukan apakah hubungan itu tergantung? Seorang penasihat penelitian yang bijak pernah mengatakan kepada saya, "korelasi tidak menyiratkan sebab-akibat, itu hanya memberi tahu Anda ke mana harus mencari".

Mari kita pertimbangkan situasi di mana peristiwa A dan B ditemukan berkorelasi temporal atau spasial. Jika kita ingin menyelidiki preposisi bahwa A menyebabkan B , garis pemikiran tradisional adalah memperkenalkan tes kebutuhan dan kecukupan - yang merupakan arti kausalitas sesungguhnya.

  • Jika tidak adanya peristiwa A mengarah pada tidak adanya acara B , itu bisa disebut perlu .
  • Jika hanya peristiwa A saja yang mengarah ke peristiwa B , itu bisa disebut cukup .

Jika tidak memiliki susu menyebabkan saya pergi ke toko , apa yang kita katakan bukanlah saya memasukkan susu kosong dan menyetir. Kausalitas absolut berarti bahwa setiap kali saya masih memiliki susu , saya tidak dapat diganggu untuk pergi ke toko; dan sebaliknya setiap kali saya di toko, itu karena saya tidak punya susu. Sekarang mudah untuk melihat masalah dengan membangun kausalitas secara positif dalam arti yang ketat: kebanyakan hal tidak sepenuhnya bersifat kausal. Ada banyak alasan lain mengapa saya pergi ke toko yang tidak ada hubungannya dengan keadaan susu.

Ini adalah cara mudah untuk mengatakan kertas yang bagus dari kertas yang bagus. Dalam penelitian yang cermat, Anda akan melihat tes kecukupan dan kebutuhan di mana-mana. Membuat klaim bahwa obat molekul kecil A dapat menyebabkan pembongkaran protein kompleks B? Anda akan segera melihat tes:

kebutuhan ----test---- ----result---- everything but B --> [nothing] (check for false positive) everything but A --> assembled everything with A-like compound --> assembled (control group)

kecukupan A + B alone (in vitro) --> disassembled (check for false negative) A + B + everything --> disassembled (trial group)

Ini adalah cara tradisional Anda membangun argumen induktif untuk kausalitas secara eksperimental MENGGUNAKAN korelasi, yang mana saya yakin dosen Anda tidak terlibat!


1
Hanya untuk menekankan intinya, ketergantungan waktu juga tidak menyiratkan hubungan sebab akibat. Kita mungkin memiliki kejadian A yang sering mengarah ke peristiwa B dan B yang menyebabkan C dan bukan A. Namun A akan berkorelasi dengan C tetapi tidak menyebabkannya.
Michael Chernick
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.