Teori sebab-akibat menawarkan penjelasan lain tentang bagaimana dua variabel bisa independen tanpa syarat namun tergantung kondisi. Saya bukan ahli teori kausal dan bersyukur atas kritik yang akan memperbaiki kesalahan arah di bawah ini.
Sebagai ilustrasi, saya akan menggunakan grafik asiklik terarah (DAG). Dalam grafik ini, tepi ( - ) antara variabel mewakili hubungan sebab akibat langsung. Kepala panah ( ← atau → ) menunjukkan arah hubungan sebab akibat. Jadi A → B menyimpulkan bahwa SEBUAH secara langsung menyebabkan B , dan A ← B menyimpulkan bahwa SEBUAH secara langsung disebabkan oleh B . A → B → C adalah jalur sebab akibat yang menyimpulkan bahwa SEBUAH secara tidak langsung menyebabkan C hingga B. Untuk kesederhanaan, anggap semua hubungan kausal adalah linier.
Pertama, perhatikan contoh sederhana bias pembaur :
Di sini, regresi bivariat sederhana akan menyarankan ketergantungan antara X dan Y . Namun, tidak ada hubungan kausal langsung antara X dan Y . Sebaliknya keduanya secara langsung disebabkan oleh Z , dan dalam regresi bivariabel sederhana, mengamati Z menginduksi ketergantungan antara X dan Y , yang menghasilkan bias dengan mengacaukan. Namun, pendingin regresi multivariabel pada Z akan menghapus bias dan menyarankan tidak ada ketergantungan antara X dan Y .
Kedua, perhatikan contoh bias collider (juga dikenal sebagai bias Berkson atau bias berksonian, di mana bias seleksi adalah tipe khusus):
Di sini, regresi bivariat sederhana akan menyarankan tidak ada ketergantungan antara X dan Y . Ini setuju dengan DAG, yang menyimpulkan tidak ada hubungan sebab akibat langsung antaraX danY . Namun, pengkondisian regresi multivariabel padaZ akan menginduksi ketergantungan antaraX danY menunjukkan bahwa hubungan sebab akibat langsung antara dua variabel mungkin ada, padahal sebenarnya tidak ada. DimasukkannyaZ dalam hasil regresi multivariabel dalam bias collider.
Ketiga, pertimbangkan contoh pembatalan insidental:
Mari kita asumsikan bahwa α , β , dan γ adalah koefisien jalur dan β= - α γ . Sebuah regresi bivariat sederhana akan menyarankan tidak depenence antara X dan Y . Meskipun X sebenarnya merupakan penyebab langsung dari Y , efek perancu dari Z pada X danY kebetulan membatalkan efek dariX padaY . Pengondisian regresi multivariabel padaZ akan menghapus efek perancuZ padaX danY , memungkinkan untuk estimasi efek langsungX padaY , dengan asumsi DAG dari model kausal benar.
Untuk meringkas:
Perancu contoh: X dan Y tergantung dalam regresi bivariat dan independen dalam pendingin regresi multivariabel pada perancu Z .
Collider contoh: X dan Y adalah independen dalam regresi bivariat dan tergantung di pendingin regresssion multivariabel pada collider Z .
Pembatalan Inicdental contoh: X dan Y adalah independen dalam regresi bivariat dan tergantung di pendingin regresssion multivariabel pada perancu Z .
Diskusi:
Hasil analisis Anda tidak kompatibel dengan contoh perancu, tetapi kompatibel dengan contoh collider dan contoh pembatalan insidental. Dengan demikian, penjelasan potensial adalah bahwa Anda telah salah mengkondisikan pada variabel collider dalam regresi multivariabel Anda dan telah menginduksi hubungan antara X dan Y meskipun X bukan penyebabY danY bukan merupakan penyebabX . Atau, Anda mungkin telah mengkondisikan dengan benar pada perancu dalam regresi multivariabel Anda yang secara kebetulan membatalkan efek sebenarnya dariX padaY dalam regresi bivariabel Anda.
Saya menemukan menggunakan latar belakang pengetahuan untuk membangun model kausal untuk membantu ketika mempertimbangkan variabel mana yang akan dimasukkan dalam model statistik. Sebagai contoh, jika penelitian acak berkualitas tinggi sebelumnya menyimpulkan bahwa X menyebabkan Z dan Y menyebabkan Z , saya bisa membuat asumsi kuat bahwa Z adalah penumbuk X dan Y dan tidak mengkondisikannya dalam model statistik. Namun, jika saya hanya memiliki intuisi yang merupakan collider dari X danX menyebabkanZ , danY menyebabkanZ , tetapi tidak ada bukti ilmiah yang kuat untuk mendukung intuisi saya, saya hanya bisa membuat asumsi yang lemah bahwaZXY , karena intuisi manusia memiliki sejarah salah arah. Selanjutnya, saya akan skeptis infering hubungan kausal antaraX danY tanpa penyelidikan lebih lanjut hubungan kausal mereka denganZ . Sebagai pengganti atau di samping pengetahuan latar belakang, ada juga algoritma yang dirancang untuk menyimpulkan model kausal dari data menggunakan servic of test of association (misalnya algoritma PC dan algoritma FCI, lihatTETRADuntuk implementasi Java,PCalguntuk implementasi R). Algoritma ini sangat menarik, tetapi saya tidak akan merekomendasikan untuk mengandalkan mereka tanpa pemahaman yang kuat tentang kekuatan dan keterbatasan kalkulus kausal dan model kausal dalam teori kausal.
Kesimpulan:
Kontemplasi model sebab-akibat tidak memaafkan simpatisan untuk menanggapi pertimbangan statistik yang dibahas dalam jawaban lain di sini. Namun, saya merasa bahwa model kausal tetap dapat memberikan kerangka kerja yang membantu ketika memikirkan penjelasan potensial untuk ketergantungan statistik yang diamati dan kemandirian dalam model statistik, terutama ketika memvisualisasikan pembaur potensial dan colliders.
Bacaan lebih lanjut:
Gelman, Andrew. 2011. " Kausalitas dan Pembelajaran Statistik ." Saya. J. Sosiologi 117 (3) (November): 955–966.
Greenland, S, J Pearl, dan JM Robins. 1999. " Diagram Kausal untuk Penelitian Epidemiologi ." Epidemiologi (Cambridge, Mass.) 10 (1) (Januari): 37-48.
Greenland, Sander. 2003. “ Mengukur Bias dalam Model Kausal: Bias Stratifikasi Kolider-Pengganggu Klasik .” Epidemiologi 14 (3) (1 Mei): 300–306.
Mutiara, Yudea. 1998. Mengapa Tidak Ada Tes Statistik Untuk Mengacaukan, Mengapa Banyak Orang Berpikir Ada, Dan Mengapa Mereka Hampir Benar .
Mutiara, Yudea. 2009. Kausalitas: Model, Penalaran dan Inferensi . 2nd ed. Cambridge University Press.
Spirtes, Peter, Clark Glymour, dan Richard Scheines. 2001. Penyebab, Prediksi, dan Pencarian , Edisi Kedua. Buku Bradford.
Pembaruan: Judea Pearl membahas teori inferensi kausal dan kebutuhan untuk memasukkan inferensi kausal ke dalam kursus statistik pengantar dalam Amstat News edisi November 2012 . -Nya Kuliah Turing Award , berjudul "The mekanisasi kausal inferensi: Sebuah Turing Test 'mini' dan di luar" juga menarik.