Saya sedikit bingung dengan jawaban di atas, maka saya akan mencoba lagi. Saya pikir pertanyaannya sebenarnya bukan tentang regresi linier 'klasik' tetapi tentang gaya sumber tertentu. Pada bagian regresi klasik:
Namun, asumsi linearitas dengan sendirinya tidak menempatkan struktur apa pun pada model kami
Itu benar sekali. Seperti yang telah Anda nyatakan, mungkin juga membunuh relasi linier dan menambahkan sesuatu yang sepenuhnya independen dari sehingga kita tidak dapat menghitung model apa pun sama sekali.XϵX
Apakah Greene ceroboh? Haruskah ia benar-benar menulis:E(y|X)=Xβ
Saya tidak ingin menjawab pertanyaan pertama tetapi izinkan saya meringkas asumsi yang Anda butuhkan untuk regresi linier biasa:
Mari kita asumsikan bahwa Anda mengamati (Anda diberi) poin data dan untuk . Anda perlu mengasumsikan bahwa data yang telah Anda amati berasal dari variabel acak yang terdistribusi secara independen dan identik sedemikian rupa sehingga ...y i ∈ R i = 1 , . . . , n ( x i , y i ) ( X i , Y i )xi∈Rdyi∈Ri=1,...,n(xi,yi)(Xi,Yi)
Ada tetap (independen dari ) sehingga untuk semua dan variabel acak sedemikian rupa sehinggaiβ∈RdYi=βXi+ϵiiϵi
The yang IID juga dan didistribusikan sebagai ( harus independen dari juga)ϵiϵiN(0,σ)σi
Untuk dan variabel memiliki kerapatan yang sama, yaitu variabel acak tunggal memiliki kerapatanX=(X1,...,Xn)Y=(Y1,...,Yn)X,Y(X,Y)fX,Y
Sekarang Anda dapat menjalankan jalan yang biasa dan menghitung
fY|X(y|x)=fY,X(y,x)/fX(x)=(12πd−−−√)nexp(−∑ni=1(yi−βxi)22σ)
sehingga dengan 'dualitas' yang biasa antara pembelajaran mesin (minimalisasi fungsi kesalahan) dan teori probabilitas (maksimalisasi kemungkinan) Anda memaksimalkan dalam yang pada kenyataannya, memberi Anda hal-hal "RMSE" yang biasa.−logfY|X(y|x)β
Sekarang seperti yang dinyatakan: Jika penulis buku yang Anda kutip ingin membuat poin ini (yang harus Anda lakukan jika Anda ingin dapat menghitung garis regresi 'terbaik' dalam pengaturan dasar) maka ya, ia harus membuat asumsi ini pada normalitas di suatu tempat di buku ini.ϵ
Ada berbagai kemungkinan sekarang:
Dia tidak menuliskan asumsi ini di dalam buku. Maka itu adalah kesalahan dalam buku.
Dia menuliskannya dalam bentuk komentar 'global' seperti 'setiap kali saya menulis maka biasanya didistribusikan dengan rata-rata nol kecuali dinyatakan sebaliknya'. Maka IMHO itu adalah gaya yang buruk karena menyebabkan kebingungan yang Anda rasakan saat ini. Itu sebabnya saya cenderung menulis asumsi dalam bentuk singkat di setiap Teorema. Hanya dengan demikian setiap blok bangunan dapat dilihat dengan bersih dalam dirinya sendiri.+ϵϵ
- Dia menuliskannya dengan cermat pada bagian yang Anda kutip dan Anda / kami tidak menyadarinya (juga kemungkinan :-))
Namun, juga dalam pengertian matematis yang ketat, kesalahan normal adalah sesuatu yang kanonik (distribusi dengan entropi tertinggi [setelah varians diperbaiki], karenanya, menghasilkan model terkuat) sehingga beberapa penulis cenderung mengabaikan asumsi ini tetapi menggunakan dalam nontheless . Secara formal, Anda benar sekali: Mereka menggunakan matematika dengan "cara yang salah". Setiap kali mereka ingin membuat persamaan untuk densitas seperti yang dinyatakan di atas maka mereka perlu tahu cukup baik, jika tidak, Anda hanya memiliki sifat-sifat itu terbang di dalam setiap persamaan yang masuk akal yang Anda coba tuliskan . ϵfY|Xϵ