Apa definisi matematis dari hubungan sebab akibat antara dua variabel acak?
Diberikan sampel dari distribusi bersama dua variabel acak dan , kapan kita mengatakan menyebabkan ?
Untuk konteks, saya membaca makalah ini tentang penemuan kausal .
Apa definisi matematis dari hubungan sebab akibat antara dua variabel acak?
Diberikan sampel dari distribusi bersama dua variabel acak dan , kapan kita mengatakan menyebabkan ?
Untuk konteks, saya membaca makalah ini tentang penemuan kausal .
Jawaban:
Apa definisi matematis dari hubungan sebab akibat antara dua variabel acak?
Secara matematis, model kausal terdiri dari hubungan fungsional antar variabel. Misalnya, pertimbangkan sistem persamaan struktural di bawah ini:
Ini berarti bahwa fungsional menentukan nilai (jika Anda mengintervensi ini mengubah nilai ) tetapi tidak sebaliknya. Secara grafis, ini biasanya diwakili oleh , yang berarti memasuki persamaan struktural y. Sebagai tambahan, Anda juga dapat mengekspresikan model sebab akibat dalam hal distribusi bersama variabel kontrafaktual, yang secara matematis setara dengan model fungsional .
Diberikan sampel dari distribusi bersama dua variabel acak X dan Y, kapan kita mengatakan X menyebabkan Y?
Terkadang (atau sebagian besar waktu) Anda tidak memiliki pengetahuan tentang bentuk persamaan struktural , , atau bahkan apakah atau . Satu-satunya informasi yang Anda miliki adalah distribusi probabilitas gabungan (atau sampel dari distribusi ini).
Ini mengarah ke pertanyaan Anda: kapan saya bisa memulihkan arah kausalitas hanya dari data? Atau, lebih tepatnya, kapan saya bisa memulihkan apakah memasuki persamaan struktural atau sebaliknya, hanya dari data?
Tentu saja, tanpa asumsi mendasar yang tidak dapat diuji tentang model sebab akibat, ini tidak mungkin . Masalahnya adalah bahwa beberapa model kausal yang berbeda dapat memerlukan distribusi probabilitas gabungan yang sama dari variabel yang diamati. Contoh paling umum adalah sistem linear kausal dengan noise gaussian.
Tetapi di bawah beberapa asumsi kausal, ini mungkin terjadi --- dan inilah yang dilakukan literatur penemuan kausal. Jika Anda tidak memiliki paparan sebelumnya untuk topik ini, Anda mungkin ingin mulai dari Elemen Inferensial Kausal oleh Peters, Janzing dan Scholkopf, serta bab 2 dari Kausalitas oleh Judea Pearl. Kami memiliki topik di sini di CV untuk referensi tentang penemuan kausal , tetapi kami belum memiliki banyak referensi yang terdaftar di sana.
Karena itu, tidak hanya ada satu jawaban untuk pertanyaan Anda, karena itu tergantung pada asumsi yang dibuatnya. Makalah yang Anda sebutkan mengutip beberapa contoh, seperti mengasumsikan model linier dengan noise non-gaussian . Kasus ini dikenal sebagai LINGAN (kependekan dari model asiklik non-gaussian linier), berikut adalah contoh dalam R
:
library(pcalg)
set.seed(1234)
n <- 500
eps1 <- sign(rnorm(n)) * sqrt(abs(rnorm(n)))
eps2 <- runif(n) - 0.5
x2 <- 3 + eps2
x1 <- 0.9*x2 + 7 + eps1
# runs lingam
X <- cbind(x1, x2)
res <- lingam(X)
as(res, "amat")
# Adjacency Matrix 'amat' (2 x 2) of type ‘pag’:
# [,1] [,2]
# [1,] . .
# [2,] TRUE .
Perhatikan di sini kita memiliki model kausal linier dengan noise non-gaussian di mana menyebabkan dan lingam dengan benar memulihkan arah kausal. Namun, perhatikan ini sangat tergantung pada asumsi LINGAM.
Untuk kasus makalah yang Anda kutip, mereka membuat asumsi khusus ini (lihat "postulat" mereka):
Jika , panjang deskripsi minimal pemetaan mekanisme X ke Y tidak tergantung pada nilai X, sedangkan panjang deskripsi minimal pemetaan mekanisme Y ke X tergantung pada nilai Y.
Perhatikan ini asumsi. Inilah yang kita sebut "kondisi identifikasi" mereka. Pada dasarnya, postulat memberlakukan pembatasan pada distribusi bersama . Yaitu, postulat mengatakan bahwa jika pembatasan tertentu berlaku dalam data, dan jika pembatasan lainnya berlaku. Jenis pembatasan ini yang memiliki implikasi yang dapat diuji (memaksakan batasan pada ) adalah yang memungkinkan seseorang untuk pulih secara terarah dari data pengamatan.
Sebagai ucapan terakhir, hasil penemuan kausal masih sangat terbatas, dan bergantung pada asumsi yang kuat, berhati-hatilah ketika menerapkannya pada konteks dunia nyata.
lm
). Kita tidak bisa semua bekerja di sekitar sampel pengamatan dataset Tuebingen untuk mendapatkan ide penemuan kausal! :)
Ada berbagai pendekatan untuk memformalisasikan kausalitas (yang sesuai dengan pertentangan filosofis substansial tentang kausalitas yang telah ada selama berabad-abad). Yang populer adalah dalam hal hasil potensial. Pendekatan potensi-hasil, yang disebut model kausal Rubin , mengandaikan bahwa untuk setiap keadaan sebab akibat, ada variabel acak yang berbeda. Jadi, mungkin variabel acak hasil yang mungkin dari percobaan klinis jika subjek mengambil obat studi, dan mungkin variabel acak jika ia mengambil plasebo. Efek sebab akibat adalah perbedaan antara dan . Jika sebenarnya , kita dapat mengatakan bahwa pengobatannya tidak berpengaruh. Kalau tidak, kita dapat mengatakan bahwa kondisi perawatan menyebabkan hasilnya.
Hubungan kausal antara variabel juga dapat diwakili dengan grafik asylical directional , yang memiliki rasa yang sangat berbeda tetapi ternyata secara matematis setara dengan model Rubin (Wasserman, 2004, bagian 17.8).
Wasserman, L. (2004). Semua statistik: Kursus singkat dalam inferensi statistik . New York, NY: Springer. ISBN 978-0-387-40272-7.
There are two ways to determine whether is the cause of . The first is standard while the second is my own claim.
An intervention is a surgical change to a variable that does not affect variables it depends on. Interventions have been formalized rigorously in structural equations and causal graphical models, but as far as I know, there is no definition which is independent of a particular model class.
To make this rigorous requires formalizing a model over and , and in particular the semantics which define how it is simulated.
In modern approaches to causation, intervention is taken as the primitive object which defines causal relationships (definition 1). In my opinion, however, intervention is a reflection of, and necessarily consistent with simulation dynamics.