I.) 2 Prinsip ekonometrik berpotensi bermanfaat dibandingkan dengan Machine Learning.
(lihat Makalah Hal R Varian 2014: https://pubs.aeaweb.org/doi/pdf/10.1257/jep.28.2.3 )
A.) Ketika Anda menyarankan pencarian kausalitas adalah satu keuntungan tetapi tidak seperti apa yang Anda pikirkan, bahkan jika kausalitas kadang-kadang sulit untuk diukur, tetap sangat berguna dan fungsional.
Tetapi pertama-tama, ketika Anda menyarankan bahwa variabel Instrumental adalah satu-satunya alat yang tersedia yang berfungsi untuk sebagian besar kasus dan memungkinkan inferensi kausal, saya pikir ada beberapa teknik lagi yang masih bisa diterapkan untuk mengukur kausalitas dalam menanggapi pengobatan, manipulasi , atau intervensi dan masih relevan (tidak seperti percobaan alami seperti yang Anda lakukan karena penerapan langsung terbatas untuk sebagian besar kasus) di sebagian besar situasi seperti:
● percobaan eksplisit
● diskontinuitas regresi
● perbedaan perbedaan
● estimasi struktural
Sebagai contoh, Anda dapat menyelidiki hubungan sebab akibat dengan teknik tesis atau variabel instrumental karena walaupun teknik tersebut tunduk pada masalah bias dan korelasi (terlebih lagi karena data besar karena peningkatan ukuran dataset membatasi kegunaan metode variabel instrumental, tergantung pada kekuatan instrumen dan tingkat perancu), masih memberi petunjuk untuk menyelidiki hubungan sebab akibat.
Dengan cara itu, misalnya, memungkinkan deteksi kontrafaktual kondisional (jika-klausa yang bertentangan dengan fakta) sementara juga memeriksa keberadaan bias seleksi potensial.
Apa itu kontrafakta bersyarat:
Jika hujan, maka dia ada di dalam. : Rain = Variabel Indikatif
Jika hujan, maka dia akan berada di dalam. : Rain = Variabel kontrafakta Bersyarat
Oleh karena itu, semakin baik model prediktif yang Anda miliki untuk kontrafaktual, semakin baik Anda dapat memperkirakan efek kausal.
Dengan demikian, meskipun model prediksi tidak selalu memungkinkan seseorang untuk menyimpulkan sesuatu tentang kausalitas dengan sendirinya, model tersebut dapat membantu dalam memperkirakan dampak kausal dari suatu intervensi ketika itu terjadi.
Karena itu dapat menyoroti sekelompok kontrafaktual bersyarat yang dapat digunakan sebagai variabel kausal potensial untuk menjalankan tes, untuk akhirnya menentukan kausalitas dalam dataset yang diberikan untuk melakukan pengambilan keputusan yang baik (bersihkan dari masalah yang membingungkan). Jika tidak, setidaknya, itu memberi Anda beberapa petunjuk untuk melakukan penyelidikan yang lebih dalam untuk memahami masalah: ada yang salah dengan teorinya? ada yang salah dengan model ekonometrik saya? ada yang salah dengan data saya?
Untuk wawasan lebih lanjut tentang pro kontra teknik inferensial kausal yang berbeda dalam ekonometrik:
https://www.jstor.org/stable/pdf/44234997.pdf?refreqid=excelsior%3A18bacfd86299dcf19e7f1f13d9c52022
B.) Kecuali hubungan sebab akibat, ketidakpastian model adalah keunggulan lain dari Ekonometrik dibandingkan dengan ML.
Landasan probabilitas ekonometrik adalah kekuatan dengan cara yang memungkinkan interpretabilitas sebagian besar model dan parameternya (menghindari fenomena kotak hitam) dan memberikan quantisation ketidakpastian (dengan interval percaya diri).
Tujuannya biasanya untuk menunjukkan bahwa perkiraan beberapa parameter yang menarik tidak terlalu sensitif terhadap spesifikasi yang digunakan: bagaimana perkiraan parameter bervariasi sebagai model yang berbeda digunakan. Pertanyaan ini menggambarkan bentuk sederhana dari ketidakpastian model.
Dalam periode "data besar" ini, tampaknya aneh untuk fokus pada ketidakpastian sampel, yang cenderung kecil dengan kumpulan data besar, sementara sama sekali mengabaikan ketidakpastian model, yang mungkin cukup besar.
Salah satu cara untuk mengatasinya adalah secara eksplisit tentang memeriksa bagaimana estimasi parameter bervariasi sehubungan dengan pilihan variabel kontrol dan instrumen.
II.) Sebaliknya teknik Machine Learning juga dapat berguna untuk analitik data dalam Ilmu sosial.
A.) Pemilihan Parameter, Metode validasi model dalam ML dapat meningkatkan model ekonometrik tradisional
Para peneliti dalam pembelajaran mesin telah mengembangkan cara-cara untuk berurusan dengan dataset besar dan para ekonom yang tertarik untuk menangani data semacam itu akan disarankan untuk berinvestasi dalam mempelajari teknik-teknik ini.
Misalnya, metode Penambangan Web dapat menemukan variabel penjelas baru yang dapat digunakan.
Validasi silang harus mengidentifikasi efek non-linear atau efek silang yang terlupakan.
Validasi Model harus mendeteksi ketika model salah ditentukan dan dengan demikian memungkinkan spesifikasi yang lebih baik dari model ekonometrik dan secara keseluruhan mengurangi bias dan kesalahan variabel yang dihilangkan.
Sebagai contoh, literatur terbaru dalam fokus keuangan pada model Garch (model seri kali tradisional) meningkat dengan Neural Network untuk memprediksi volatilitas dan harga aset yang lebih baik.
Untuk wawasan lebih lanjut tentang kegunaan ML dalam ekonometrik, periksa makalah ini oleh Arthur Charpentier: https://arxiv.org/pdf/1708.06992.pdf
B.) Pemodelan Kausal mulai menjadi perhatian dan bidang penelitian di ML. Yang berarti bahwa dalam jangka panjang ML berpotensi mengatasi kekurangannya sendiri (seperti berfokus secara eksklusif pada kesesuaian) dan mengungguli Ekonometrika.
Beberapa ilmuwan komputer Teoritis, seperti Pearl (2009a, b) miliki
membuat kontribusi signifikan untuk pemodelan kausal dalam ilmu komputer (dengan pembelajaran mesin ekstensi):
(lihat: Kesimpulan Kausal dalam Statistik: A Primer Wiley, 2016 Judea Pearl et Al)
Pearl mendefinisikan kontrafaktual secara langsung dalam hal "model persamaan struktural" - seperangkat persamaan, di mana setiap variabel diberi nilai yang merupakan fungsi eksplisit dari variabel lain dalam sistem. Diberikan model seperti itu, kalimat "Y akan menjadi y seandainya X menjadi x" (secara resmi, X = x & gt; Y = y) didefinisikan sebagai pernyataan: Jika kita mengganti persamaan yang saat ini menentukan X dengan konstanta X = x, dan menyelesaikan serangkaian persamaan untuk variabel Y, solusi yang diperoleh adalah Y = y. Definisi ini telah terbukti kompatibel dengan aksioma kemungkinan semantik dunia dan membentuk dasar untuk inferensial kausal dalam ilmu-ilmu alam dan sosial, karena setiap persamaan struktural dalam domain tersebut sesuai dengan mekanisme sebab-akibat yang lazim yang dapat dipertimbangkan secara bermakna oleh para peneliti .
Namun, tampaknya kemajuan teoretis ini belum dimasukkan ke dalam praktik pembelajaran mesin. Kecuali dalam beberapa makalah penelitian terbaru:
http://www.nasonline.org/programs/sackler-colloquia/documents/athey.pdf
Sebagai Kesimpulan, menurut pendapat saya dan sekarang, Econometrics sebagai input yang lebih berharga dalam ilmu sosial daripada apa yang bisa dipelajari dengan pembelajaran mesin Jadi masih memadai untuk menggunakan ekonometrik untuk melakukan analisis data, bukan teknik ML.