Ada beberapa perbedaan terminologis di mana hal yang sama disebut nama yang berbeda dalam disiplin ilmu yang berbeda:
- Data longitudinal dalam biostatistik adalah pengamatan berulang pada individu yang sama = data panel dalam ekonometrik.
- Model untuk variabel dependen biner di mana probabilitas 1 dimodelkan sebagai disebut model logit dalam ekonometrik, dan model logistik dalam biostatistik. Ahli biostasis cenderung bekerja dengan regresi logistik dalam hal rasio odds, karena mereka sering bersifat biner, sehingga odds ratio mewakili frekuensi relatif dari hasil yang diinginkan pada dua kelompok dalam populasi. Ini adalah interpretasi yang umum sehingga Anda akan sering melihat variabel kontinu diubah menjadi dua kategori (tekanan darah rendah vs tinggi) untuk membuat interpretasi ini lebih mudah.x1/(1+exp[−x′β])x
- "Persamaan estimasi" ahli statistik adalah "kondisi momen" ekonometrika. Statistik -estimates yang ekonometri estimator ekstrem.M
Ada perbedaan terminologis di mana istilah yang sama digunakan untuk mengartikan hal yang berbeda dalam disiplin ilmu yang berbeda:
- Efek tetap berarti dalam persamaan regresi untuk ahli statistik ANOVA, dan untuk estimator "dalam" untuk para ahli ekonometrika.x′β
- Kesimpulan kuat berarti kesalahan standar yang dikoreksi secara heteroskedastisitas untuk ekonom (dengan ekstensi ke kesalahan standar yang dikelompokkan dan / atau kesalahan standar yang dikoreksi-autokorelasi) dan metode yang kuat untuk jauh melampaui pencilan statistik.
- Tampaknya para ekonom memiliki ide konyol bahwa sampel bertingkat adalah mereka yang probabilitas seleksi bervariasi di antara pengamatan. Ini harus disebut sampel probabilitas tidak sama. Sampel berstrata adalah sampel di mana populasi dibagi menjadi kelompok-kelompok yang telah ditentukan sebelumnya sesuai dengan karakteristik yang diketahui sebelum pengambilan sampel dilakukan.
- "Penambangan data" ahli ekonometrika (setidaknya dalam literatur tahun 1980-an) digunakan untuk mengartikan berbagai pengujian dan perangkap yang terkait dengannya yang telah dijelaskan secara menakjubkan dalam buku Harrell . Prosedur penambangan data ilmuwan komputer (dan ahli statistik) adalah metode non-parametrik untuk menemukan pola dalam data, juga dikenal sebagai pembelajaran statistik .
Saya melihat kontribusi unik ekonometrik menjadi
- Cara untuk berurusan dengan endogenitas dan model regresi yang tidak ditentukan, mengakui, sebagaimana mpiktas telah menjelaskan dalam jawaban lain , bahwa (i) variabel penjelas mungkin sendiri acak (dan karenanya berkorelasi dengan kesalahan regresi yang menghasilkan bias dalam estimasi parameter), (ii) model dapat menderita dari variabel yang dihilangkan (yang kemudian menjadi bagian dari istilah kesalahan), (iii) mungkin ada heterogenitas yang tidak teramati tentang bagaimana agen ekonomi bereaksi terhadap rangsangan, sehingga menyulitkan model regresi standar. Angrist & Pischke adalah ulasan yang bagus tentang masalah ini, dan ahli statistik akan belajar banyak tentang bagaimana melakukan analisis regresi darinya. Paling tidak, ahli statistik harus belajar dan memahami regresi variabel instrumental.
- Secara umum, para ekonom ingin membuat asumsi sesedikit mungkin tentang model mereka, sehingga untuk memastikan bahwa temuan mereka tidak bergantung pada sesuatu yang konyol seperti normalitas multivariat. Itu sebabnya GMM sangat populer dengan ekonom, dan tidak pernah terjebak dalam statistik (meskipun itu digambarkan sebagai minimum oleh Ferguson pada akhir tahun 1960). Itu sebabnya adopsi kemungkinan empiris tumbuh secara eksponensial dalam ekonometrik, dengan sedikit pengikut dalam statistik. Itu sebabnya para ekonom menjalankan regresi mereka dengan kesalahan standar "kuat", dan ahli statistik, dengan OLS default kesalahan standar.s 2 ( X ′ X ) - 1χ2s2(X′X)−1
- Ada banyak pekerjaan dalam domain waktu dengan proses spasi secara teratur - begitulah cara mengumpulkan data ekonomi makro. Kontribusi unik mencakup proses terintegrasi dan terkointegrasi dan metode heteroskedastisitas kondisional autoregresif (G) ARCH). Menjadi orang mikro umumnya, saya kurang akrab dengan ini.
Secara keseluruhan, ekonom cenderung mencari interpretasi yang kuat dari koefisien dalam model mereka. Para ahli statistik akan menggunakan model logistik sebagai cara untuk mendapatkan probabilitas hasil positif, seringkali sebagai alat prediksi sederhana, dan mungkin juga mencatat interpretasi GLM dengan properti keluarga eksponensial yang bagus yang dimilikinya, serta koneksi dengan analisis diskriminan. Ekonom akan berpikir tentang interpretasi utilitas dari model logit, dan khawatir bahwa hanya yang diidentifikasi dalam model ini, dan bahwa heteroskedastisitas dapat membuangnya. (Ahli statistik akan bertanya-tanya apa ituσβ/σσ adalah para ekonom yang berbicara tentang, tentu saja.) Tentu saja, sebuah utilitas yang linier dalam inputnya adalah hal yang sangat lucu dari perspektif Ekonomi Mikro 101, meskipun beberapa generalisasi ke fungsi semi-cekung mungkin dilakukan di Mas-Collel.
Apa yang umumnya cenderung dilewatkan oleh para ekonom, tetapi, IMHO, akan mendapat manfaat dari, adalah aspek-aspek analisis multivariat (termasuk model variabel laten sebagai cara untuk mengatasi kesalahan pengukuran dan banyak proxy ... ahli statistik tidak menyadari model-model ini, meskipun, juga) , diagnostik regresi (semua jarak Cook ini, Mallows 'Cp, DFBETA, dll.), Analisis data yang hilang (identifikasi parsial Manski tentu saja bagus, tetapi penguraian MCAR / MAR / NMAR utama dan beberapa imputasi lebih berguna), dan statistik survei. Banyak kontribusi lain dari statistik arus utama telah dihibur oleh ekonometrika dan baik diadopsi sebagai metodologi standar, atau disahkan sebagai mode jangka pendek: model ARMA tahun 1960-an mungkin lebih dikenal dalam ekonometrik daripada dalam statistik, karena beberapa program pascasarjana dalam statistik mungkin gagal untuk menawarkan kursus seri waktu hari ini; estimator penyusutan / regresi ridge tahun 1970-an telah datang dan pergi; bootstrap tahun 1980-an adalah reaksi spontan untuk setiap situasi yang rumit, walaupun para ekonom perlu lebih menyadari keterbatasan bootstrap tersebut.; kemungkinan empiris dari tahun 1990-an telah melihat lebih banyak pengembangan metodologi dari para ahli ekonometrik teoretis daripada dari ahli statistik teoretis; metode Bayesian komputasi tahun 2000-an dihibur dalam ekonometrik, tetapi perasaan saya adalah yang terlalu parametrik, terlalu berbasis model, agar kompatibel dengan paradigma kekokohan yang saya sebutkan sebelumnya. Apakah para ekonom akan menemukan penggunaan pembelajaran statistik / bioinformatika atau hal-hal temporal yang sangat panas dalam statistik modern adalah panggilan terbuka.