Distribusi normal koefisien regresi multivariat?


12

Saat membaca buku teks tentang regresi saya menemukan paragraf berikut:

Estimasi kuadrat terkecil dari vektor koefisien regresi linier ( ) adalahβ

β^=(XtX)-1Xty

yang, bila dipandang sebagai fungsi data (dengan mempertimbangkan prediktor sebagai konstanta), adalah kombinasi linear dari data. Menggunakan Teorema Batas Pusat, dapat ditunjukkan bahwa distribusi akan mendekati multivariat normal jika ukuran sampel besar.X βyXβ

Saya benar-benar kehilangan sesuatu dari teks, tetapi saya tidak mengerti bagaimana bisa nilai tunggal memiliki distribusi? Bagaimana beberapa nilai dihasilkan untuk mendapatkan distribusi yang dimaksud dalam teks?βββ


4
adalah vektor koefisien regresi - apakah itu menjernihkan kebingungan? β
Makro

5
Saat menggunakan pendekatan kuadrat terkecil, Anda menganggap bahwa sudah diperbaiki tetapi tidak diketahui. Namun, β , karena itu fungsi dari data (random), memiliki distribusi. Distribusi asimtotik adalah distribusi normal. Non-asimtotik, koefisien individu akan berada pada distribusi. ββ^
Taylor

7
Mungkin membantu untuk mengamati bahwa dianggap sebagai matriks konstan dalam pengaturan regresi dan bahwa y adalah realisasi dari variabel acak (bernilai vektor). Namun, sedikit tentang CLT itu tidak sepenuhnya benar: ia mengandalkan baik pada H yang memiliki struktur tertentu, yang kadang-kadang tidak benar-benar terjadi bahkan dengan kumpulan data yang besar, atau yang lain pada y itu sendiri menjadi multivariat normal (tetapi kemudian tidak perlu untuk aktifkan CLT). H=(XtX)-1XtyHy
whuber

@Taylor Tapi bagaimana Anda tahu distribusi B jika satu-satunya yang saya tahu adalah "ukuran sampel besar"?
atas

2
@Taylor Komponen individual dari beta vactor akan memiliki distribusi hanya jika komponen kesalahan dalam model regresi adalah Gaussian dengan 0 mean dan varians konstan. Dalam kasus non-normal Anda tidak perlu mengetahui distribusinya di bawah hipotesis nol tetapi mungkin masih asimtotik normal. Namun ketika Whuber menyatakan teorema batas pusat mungkin tidak berlaku karena itu adalah rata-rata tertimbang dan kita perlu tahu bahwa bobot tidak berubah dengan ukuran sampel dengan cara yang memungkinkan beberapa istilah untuk mendominasi jumlah.
Michael R. Chernick

Jawaban:


5

Tidak memiliki distribusi tetapi β , seperti yang ditunjukkan oleh Taylor. Distribusi β berasal dari kenyataan bahwa Anda mendapatkan yang berbeda β untuk sampel yang berbeda .--- Anda dapat memperkirakan distribusi ini didasarkan pada tunggal β diterima dari sampel tunggal Anda dengan syarat bahwa Anda memiliki beberapa informasi mengenai distribusi data yang mendasarinya.ββ^β^β^β^

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.