Pertimbangkan model regresi linier yang dipostulatkan
ysaya=b0+b1X1 i+b2X2 i+kamusaya,i = 1 , . . . , n
Sebagai soal aljabar (dan bukan asumsi stokastik), estimator OLS dalam notasi matriks adalah
b^= b +(X′X )- 1X′kamu
Nilai yang diharapkan tergantung pada matriks regressor
E(b^∣ X ) = b +(X′X )- 1X′E( u ∣ X )
Jadi: Jika "eksogenitas ketat" dari para regressor berkenaan dengan istilah error berlaku, atau, dengan kata lain, jika semua istilah error berarti independen dari semua regressor, masa lalu sekarang dan masa depan, (yang merupakan asumsi tolok ukur dalam Klasik Model Regresi Linier), yaitu jikaE( u ∣ X ) = 0, kami akan memiliki
E(b^∣ X ) = b + 0 ⇒ E(b^) = b
menggunakan juga hukum harapan yang diulang-ulang.
Dengan semua hal di atas, apa yang dimaksud dengan "variabel tak berguna"? Saya ambil, itu berarti "tidak terkait" dengan variabel dependen. Tetapi "tidak berhubungan" harus diterjemahkan sebagai "independen secara stokastik". Tetapi jika itu independen dari variabel dependen, berarti independen dari istilah kesalahan (dan juga sangat eksogen sehubungan dengan itu), jadi semua hal di atas berlaku untuk setiap variabel berlebihan juga, dan penaksir OLS tidak bias bahkan jika, katakanlah, variabelX2 adalah "berlebihan" dan model yang sebenarnya tidak mengandungnya.
Ini adalah bagaimana para ahli ekonometrika memahami masalah ini. Sekarang, dalam pengaturan yang lebih umum, "berlebihan" dapat berarti mengatakan,X2 independen dari y tergantung pada kehadiran X1(Yang saya duga lebih dekat dengan apa yang ada dalam pikiran Pearl). Masih, selamaX2 benar-benar eksogen dengan istilah kesalahan, hasil ketidakberpihakan berlaku.