Regresi linier: apakah ada distribusi tidak normal yang memberikan identitas OLS dan MLE?


13

Pertanyaan ini terinspirasi dari diskusi panjang dalam komentar di sini: Bagaimana regresi linier menggunakan distribusi normal?

Dalam model regresi linier biasa, untuk kesederhanaan di sini ditulis dengan hanya satu prediktor:

Yi=β0+β1xi+ϵi
mana xi dikenal konstanta dan ϵi adalah istilah kesalahan independen nol-rata. Jika kita selain mengasumsikan distribusi normal untuk kesalahan, maka biasanya kuadrat penduga dan estimator maksimum kemungkinan β0,β1 adalah identik.

Jadi pertanyaan mudah saya: apakah ada distribusi lain untuk istilah kesalahan sedemikian rupa sehingga mle identik dengan estimator squaeres paling biasa? Implikasi yang satu mudah ditunjukkan, yang lain tidak.


1
(+1) Ini harus menjadi distribusi yang berpusat di sekitar nol, dan tampaknya akan membantu jika itu adalah yang simetris. Beberapa kandidat yang datang ke pikiran, seperti distribusi t-atau Laplace tampaknya tidak melakukan trik seperti MLE, bahkan dalam kasus hanya konstan, tidak tersedia dalam bentuk tertutup atau diberikan oleh median, masing-masing.
Christoph Hanck

lihat juga stats.stackexchange.com/questions/99014/… , sepertinya hanya ada begitu banyak yang bisa ditemukan
Christoph Hanck

Saya yakin jawabannya tidak. Mungkin sulit untuk menulis bukti yang keras.
Gordon Smyth

Jawaban:


11

Dalam estimasi kemungkinan maksimum, kami menghitung

β^ML:lnf(ϵi)β=0f(ϵi)f(ϵi)xi=0

hubungan terakhir dengan mempertimbangkan struktur linearitas dari persamaan regresi.

Sebagai perbandingan, penaksir OLS memenuhi

ϵixi=0

Untuk mendapatkan ekspresi aljabar identik untuk koefisien kemiringan, kita harus memiliki kerapatan untuk istilah kesalahan sehingga

f(ϵi)f(ϵi)=±cϵif(ϵi)=±cϵif(ϵi)

Ini adalah persamaan diferensial dari bentuk y=±xy yang punya solusi

1ydy=±xdxlny=±12x2

y=f(ϵ)=exp{±12cϵ2}

Setiap fungsi yang memiliki kernel ini dan terintegrasi ke kesatuan atas domain yang sesuai, akan membuat MLE dan OLS untuk koefisien kemiringan identik. Yaitu yang kita cari

g(x)=Aexp{±12cx2}:abg(x)dx=1

g

Pasti. Tetapi satu hal lagi yang harus dipertimbangkan adalah sebagai berikut: jika seseorang menggunakan tanda tambah dalam eksponen, dan dukungan simetris sekitar nol misalnya, seseorang akan mendapatkan kepadatan yang memiliki minimum unik di tengah, dan dua maksimum lokal di batas-batas dukungan.


Jawaban bagus (+1), tetapi jika seseorang menggunakan tanda tambah pada fungsi, apakah ini bahkan kepadatan? Akan muncul kemudian bahwa fungsi memiliki integral tak terbatas dan dengan demikian tidak dapat dinormalisasi ke fungsi kepadatan. Jika itu masalahnya, kita hanya memiliki distribusi normal.
Pasang kembali Monica

1
(a,b)

Itu benar - saya berasumsi itu.
Pasang kembali Monica

5

argβ0,β1mini=1n(yiβ0β1xi)2
f(y|x,β0,β1)
argβ0,β1mini=1nlog{f(yi|xi,β0,β1)}=argβ0,β1mini=1n(yiβ0β1xi)2
f(y|x,β0,β1)=f0(y|x)exp{ω(yiβ0β1xi)2}
f0(y|x)(β0,β1)

y

h(||yXβ||)
h()ϵi

1
Ini tidak terlihat benar bagi saya. Jika Anda menggunakan distribusi simetris bola yang berbeda, bukankah itu mengarah pada minimalisasi fungsi norma yang berbeda dari kuadrat (sehingga tidak menjadi estimasi kuadrat-terkecil)?
Pasang kembali Monica

1

Saya tidak tahu tentang pertanyaan ini sampai @ Xi'an baru saja diperbarui dengan jawaban. Ada solusi yang lebih umum. Distribusi keluarga eksponensial dengan beberapa parameter tetap menghasilkan divergensi Bregman. Untuk distribusi seperti itu artinya adalah minimizer. OLS minimizer juga berarti. Oleh karena itu untuk semua distribusi seperti itu, mereka harus bertepatan ketika fungsional linier dikaitkan dengan parameter rata-rata.

http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.75.6958&rep=rep1&type=pdf

enter image description here

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.