Katakanlah saya memiliki pengamatan N, mungkin beberapa faktor dan saya mengulangi setiap pengamatan dua kali (atau M kali) bagaimana sebuah regresi pada set ukuran baru NM dibandingkan dengan regresi hanya pada pengamatan asli?
Katakanlah saya memiliki pengamatan N, mungkin beberapa faktor dan saya mengulangi setiap pengamatan dua kali (atau M kali) bagaimana sebuah regresi pada set ukuran baru NM dibandingkan dengan regresi hanya pada pengamatan asli?
Jawaban:
Secara konseptual, Anda menambahkan tidak ada informasi "baru", tetapi Anda "tahu" informasi itu lebih tepat.
Ini karena itu akan menghasilkan koefisien regresi yang sama, dengan kesalahan standar yang lebih kecil.
Sebagai contoh, di Stata, fungsi ekspansi x menduplikasi setiap pengamatan x kali.
sysuse auto, clear
regress mpg weight length
------------------------------------------------------------------------------
mpg | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
weight | -.0038515 .001586 -2.43 0.018 -.0070138 -.0006891
length | -.0795935 .0553577 -1.44 0.155 -.1899736 .0307867
_cons | 47.88487 6.08787 7.87 0.000 35.746 60.02374
------------------------------------------------------------------------------
expand 5
regress mpg weight length
------------------------------------------------------------------------------
mpg | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
weight | -.0038515 .0006976 -5.52 0.000 -.0052232 -.0024797
length | -.0795935 .0243486 -3.27 0.001 -.1274738 -.0317131
_cons | 47.88487 2.677698 17.88 0.000 42.61932 53.15043
------------------------------------------------------------------------------
Seperti yang Anda lihat, koefisien (panjang) yang sebelumnya tidak penting menjadi signifikan secara statistik dalam model yang diperluas, mewakili ketepatan yang dengannya Anda "tahu" apa yang Anda ketahui.
Regresi linier biasa menyelesaikan masalah