Apa yang bisa dikatakan model statistik tentang sebab akibat? Pertimbangan apa yang harus dibuat ketika membuat kesimpulan kausal dari model statistik?
Hal pertama yang harus diperjelas adalah bahwa Anda tidak dapat membuat kesimpulan kausal dari model statistik murni. Tidak ada model statistik yang dapat mengatakan apa pun tentang sebab akibat tanpa asumsi sebab akibat. Artinya, untuk membuat inferensial kausal Anda memerlukan model kausal .
Bahkan dalam sesuatu yang dianggap sebagai standar emas, seperti Percobaan Kontrol Acak (RCT), Anda perlu membuat asumsi kausal untuk melanjutkan. Biarkan saya menjelaskannya. Misalnya, anggap adalah prosedur pengacakan, perlakuan yang menarik dan hasil yang diinginkan. Saat mengasumsikan RCT sempurna, inilah yang Anda asumsikan:ZXY
Dalam hal ini sehingga semuanya bekerja dengan baik. Namun, misalkan Anda memiliki kepatuhan yang tidak sempurna yang mengakibatkan hubungan terkutuk antara dan . Lalu, sekarang, RCT Anda terlihat seperti ini:P(Y|do(X))=P(Y|X)XY
Anda masih dapat melakukan niat untuk menangani analisis. Tetapi jika Anda ingin memperkirakan efek sebenarnya dari hal-hal tidak sederhana lagi. Ini adalah pengaturan variabel instrumental, dan Anda mungkin dapat mengikat atau bahkan menunjukkan efek jika Anda membuat beberapa asumsi parametrik .X
Ini bisa menjadi lebih rumit. Anda mungkin memiliki masalah kesalahan pengukuran, subjek mungkin berhenti studi atau tidak mengikuti instruksi, di antara masalah lainnya. Anda perlu membuat asumsi tentang bagaimana hal-hal itu terkait dengan proses dengan inferensi. Dengan data pengamatan "murni" ini bisa menjadi lebih bermasalah, karena biasanya para peneliti tidak akan memiliki ide yang baik tentang proses pembuatan data.
Oleh karena itu, untuk menarik kesimpulan kausal dari model, Anda perlu menilai tidak hanya asumsi statistiknya, tetapi yang paling penting adalah asumsi penyebabnya. Berikut adalah beberapa ancaman umum terhadap analisis kausal:
- Data tidak lengkap / tidak tepat
- Kuantitas kausal target tidak terlalu jelas (Apa efek kausal yang ingin Anda identifikasi? Apa populasi target?)
- Confounding (perancu yang tidak teramati)
- Bias seleksi (pemilihan sendiri, sampel terpotong)
- Kesalahan pengukuran (yang dapat menyebabkan gangguan, tidak hanya noise)
- Kesalahan spesifikasi (mis., Bentuk fungsional yang salah)
- Masalah validitas eksternal (kesimpulan salah untuk populasi target)
Kadang-kadang klaim tidak adanya masalah ini (atau klaim untuk mengatasi masalah ini) dapat didukung oleh desain penelitian itu sendiri. Itu sebabnya data eksperimental biasanya lebih kredibel. Namun, kadang-kadang, orang akan menganggap masalah ini baik dengan teori atau untuk kenyamanan. Jika teorinya lunak (seperti dalam ilmu sosial) akan lebih sulit untuk mengambil kesimpulan pada nilai nominal.
Setiap kali Anda berpikir ada asumsi yang tidak dapat didukung, Anda harus menilai seberapa sensitif kesimpulan itu terhadap pelanggaran yang masuk akal terhadap asumsi-asumsi tersebut --- ini biasanya disebut analisis sensitivitas.