Bagaimana Anda menemukan hubungan kausal dalam data?


11

Katakanlah saya punya tabel dengan kolom "A", "B"

Apakah ada metode statistik untuk menentukan apakah "A" menyebabkan "B" terjadi? Seseorang tidak dapat menggunakan Pearson's r, karena:

  • hanya menguji korelasi antara nilai-nilai
  • korelasi bukanlah sebab-akibat
  • Pearson's r hanya dapat menghubungkan hubungan linier

Jadi, opsi apa lagi yang saya miliki di sini?


1
Tidak ada. Dari data tersebut Anda dapat menunjukkan tingkat korelasi yang tinggi; Anda tidak dapat menunjukkan penyebabnya.


1
Penyebab bukan hanya sesuatu yang dapat Anda peras dari angka ... jadi, ulangi setelah saya: sebab bukan bukan korelasi , sebab bukan bukan korelasi ...
JM bukan ahli statistik

1
Lihat "Kausalitas" oleh Judea Pearl (pemenang Turing Award 2011).

Jawaban:


4

Jawaban dan komentar sejauh ini pada dasarnya benar pada tingkat praktis, tetapi untuk kelengkapan, ada penelitian ke dalam apa yang disebut model kausalitas yang didasarkan pada statistik Bayesian dan teori grafik. Jadi meskipun dalam korelasi umum memang tidak menyiratkan sebab-akibat, ada model yang lebih kompleks yang berupaya untuk menghilangkan sebab-akibat. Lihat buku Kausalitas oleh Judea Pearl untuk detail lebih lanjut, tetapi ini matematika yang sangat berat dan mungkin bukan yang Anda inginkan.


2

Ada banyak yang disebut metode eksperimen semu yang dengannya Anda dapat berdebat tentang kausalitas, meskipun data Anda bersifat observasional. Metode-metode ini biasanya bergantung pada menemukan sumber variasi eksogen dalam variabel yang Anda minati.

Saya pikir gambaran yang baik dan dapat diakses diberikan dalam buku "Mostly Harmless Econometrics". Mereka pada dasarnya mencakup semua metode eksperimen semu yang diyakini orang (artinya: ekonom) (setidaknya kadang-kadang). Mereka tidak mencakup metode yang disebutkan oleh misalnya trb456 (untuk alasan yang sama: tidak banyak yang mempercayainya).


1

Untuk menentukan sebab-akibat Anda perlu melakukan tes pengacakan. Anda mengambil subjek tes Anda, dan secara acak memilih setengah dari mereka untuk memiliki kualitas A dan setengah untuk tidak memilikinya. Anda kemudian melihat apakah ada perbedaan yang signifikan secara statistik dalam kualitas B antara kedua kelompok.

SEBUAHB

Perhatikan bahwa mungkin tidak mungkin untuk melakukan tes pengacakan yang ingin Anda lakukan. Misalnya, bagaimana Anda bisa menguji jika tinggi menyebabkan Anda lebih berat? Tentu saja ada korelasi antara tinggi dan berat badan, tetapi Anda tidak dapat secara acak menetapkan satu kelompok orang ke kelompok 'tinggi' dan satu ke kelompok 'pendek'. Dalam hal ini, uji pengacakan tidak dapat dilakukan.


0

Somers akan bekerja untuk menjelaskan hubungan antara variabel ordinal dengan cara yang dilakukan koefisien korelasi pearson untuk set data.


1
Saya setuju bahwa dibutuhkan lebih dari angka untuk menetapkan sebab-akibat. Bagaimana penggunaan variabel ordinal masuk ke dalam pertanyaan?
Michael R. Chernick

1
@MichaelChernick Somers 'D adalah ukuran asosiasi yang asimetris. Ia dapat membedakan antara "jika hujan, maka berawan, 'dari" jika berawan, maka hujan. "Ia berfungsi untuk data ordinal atau lebih tinggi. Ia tidak membangun sebab-akibat, tetapi ia membangun directionality.
Dave Harris
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.