Contoh Balik
Masalahnya tampaknya tidak berarti independensi (kondisi di mana ) menyiratkan bahwa dan tidak berkorelasi. Jika dan tidak berkorelasi, secara umum tidak benar bahwa mereka berarti independen. Jadi sejauh ini sepertinya tidak bermasalah.E[Y|X]=E[Y]YXXY
Namun, misalkan Anda memiliki hubungan (kita dapat menyebutnya kausal) didefinisikan sebagai , di mana didistribusikan dengan distribusi normal standar dan didistribusikan dengan distribusi Rademacher sehingga atau , masing-masing dengan probabilitas ( lihat artikel Wikipedia ini ). Kemudian perhatikan bahwa . Di bawah definisi Anda, hubungan ini tidak akan causa meskipun jelas tergantung pada .Y=WXXWW=1−11/2E[Y|X]=E[Y]YX
Contoh Cara Berpikir Formal Tentang Kausalitas
Untuk memberi Anda mungkin cara yang lebih jelas dan lebih matematis untuk melihat kausalitas, ambil contoh berikut. (Saya meminjam contoh ini dari buku "Mostly Harmless Econometrics.") Misalkan Anda ingin menganalisis efek rawat inap terhadap kesehatan. Tentukan sebagai ukuran kesehatan individu dan untuk menunjukkan apakah individu tersebut dirawat di rumah sakit atau tidak. Dalam upaya pertama kami, anggaplah kita melihat perbedaan rata-rata kesehatan kedua jenis individu:
YiiDi∈{0,1}
E[Yi|Di=1]−E[Yi|Di=0].
Pada pandangan pertama pada data, Anda mungkin memperhatikan, secara intuitif, bahwa orang yang telah dirawat di rumah sakit sebenarnya memiliki kesehatan yang lebih buruk daripada mereka yang tidak. Namun, pergi ke rumah sakit tentu tidak membuat orang sakit. Sebaliknya, ada bias seleksi. Orang yang pergi ke rumah sakit adalah orang-orang yang kesehatannya lebih buruk. Jadi langkah pertama ini tidak berhasil. Mengapa? Karena kita tidak tertarik hanya pada perbedaan yang
diamati , tetapi lebih pada perbedaan potensial (kita ingin tahu apa yang akan terjadi di dunia kontra faktual).
Tetapkan hasil potensial dari setiap individu sebagai berikut:
adalah kesehatan individu jika dia tidak pergi ke rumah sakit, terlepas dari apakah dia benar-benar pergi atau tidak (kami ingin memikirkan kontrafaktual) dan dengan cara yang sama, adalah kesehatan individu adalah dia memang pergi. Sekarang, tulis hasil yang diamati sebenarnya dalam hal potensi,
Jadi, . Sekarang, kita dapat mendefinisikan efek kausal sebagai
Potential Outcome={Y1,iY0,iif Di=1if Di=0.
Y0,iiY1,iYi={Y1,iY0,iif Di=1if Di=0.
Yi=Y0,i+(Y1,i−Y0,i)DiY1,i−Y0,i . Ini berhasil karena dari segi potensi. Sekarang, anggaplah kita kembali melihat perbedaan yang diamati dalam kesehatan rata-rata:
Perhatikan bahwa istilah dapat diartikan sebagai efek pengobatan rata-rata pada yang diobati dan sebagai bias dalam seleksi. Sekarang, jika perawatan diberikan secara acak, maka kita miliki
E[Yi|Di=1]−E[Yi|Di=0]=E[Y1,i|Di=1]−E[Y0,i|Di=1]+E[Y0,i|Di=1]−E[Y0,i|Di=0].
E[Y1,i|Di=1]−E[Y0,i|Di=1]E[Y0,i|Di=1]−E[Y0,i|Di=0]DiE[Yi|Di=1]−E[Yi|Di=0]=E[Y1,i|Di]−E[Y0,i|Di=0]=E[Y1,i|Di]−E[Y0,i|Di=1]=E[Y1,i−Y0,i|Di=1]=E[Y1,i−Y0,i],
mana kita melihat bahwa adalah efek kausal rata-rata yang kami minati Ini adalah cara berpikir dasar tentang kausalitas.
E[Y1,i−Y0,i]