Sebuah probabilistik Struktural kausal Model (SCM) didefinisikan sebagai tupel di mana U adalah seperangkat variabel exogeneous, V satu set variabel endogen, F adalah satu set persamaan struktural yang menentukan nilai masing-masing variabel endogen dan P ( U ) distribusi probabilitas atas domain dari U .M.=⟨U,V,F,P(U)⟩UVFP(U)U
Dalam SCM kita mewakili efek intervensi pada variabel oleh submodel M x = ⟨ U , V , F x , P ( U ) ⟩ mana F x menunjukkan bahwa persamaan struktural untuk X digantikan oleh persamaan intervensi baru . Misalnya, intervensi atom pengaturan variabel X ke nilai spesifik x --- biasanya dilambangkan dengan d o ( X = x ) --- terdiri dari mengganti persamaan untuk XXMx=⟨U,V,Fx,P(U)⟩FxXXxdo(X=x)Xdengan persamaan .X=x
Untuk memperjelas ide, bayangkan model kausal struktural nonparametrik didefinisikan oleh persamaan struktural berikut:M
Z=UzX=f(Z,Ux)Y=g(X,Z,Uy)
Di mana gangguan memiliki beberapa distribusi probabilitas P ( U ) . Ini menginduksi distribusi probabilitas atas variabel endogen P M ( Y , Z , X ) , dan khususnya distribusi bersyarat Y yang diberikan X , P M ( Y | X ) .UP(U)PM(Y,Z,X)YXPM(Y|X)
Tapi pemberitahuan adalah "pengamatan" distribusi Y diberikan X dalam konteks model M . Apa efeknya pada distribusi Y jika kita melakukan intervensi pada pengaturan X ke x ? Ini tidak lebih dari distribusi probabilitas Y yang diinduksi oleh model yang dimodifikasi M x :PM(Y|X)YXMYXxYMx
Z=UzX=xY=g(X,Z,Uy)
Artinya, probabilitas intervensi jika kita menetapkan X = x diberikan oleh probabilitas yang diinduksi dalam submodel M x , yaitu, P M x ( Y | X = x ) dan biasanya dilambangkan dengan P ( Y | d o ( X = x ) ) . Operator d o ( X = x ) menjelaskan bahwa kami menghitung probabilitas YYX=xMxPMx(Y|X=x)P(Y|do(X=x))do(X=x)Ydalam submodel di mana ada intervensi pengaturan sama dengan x , yang sesuai dengan mengesampingkan persamaan struktural X dengan persamaan X = x .XxXX=x
Tujuan dari banyak analisis adalah untuk menemukan bagaimana mengekspresikan distribusi intervensi dalam hal probabilitas gabungan dari distribusi pengamatan (pra-intervensi).P(Y|do(X))
lakukan-kalkulus
The do-kalkulus bukanlah hal yang sama seperti operator. The do-kalkulus terdiri dari tiga aturan inferensi untuk bantuan "pijat" distribusi probabilitas pasca-intervensi dan P ( Y | d o ( X ) ) dalam hal observasional (pra-intervensi) distribusi. Karenanya, alih-alih melakukan derivasi dengan tangan, seperti dalam pertanyaan ini, Anda dapat membiarkan algoritme melakukan derivasi dan secara otomatis memberi Anda ekspresi nonparametrik untuk mengidentifikasi permintaan kausal Anda yang menarik (do(⋅)P(Y|do(X))dan do-calculus lengkap untuk model sebab akibat struktural nonparametrik rekursif ).