jawaban whuber sangat bagus! (+1) Saya mengatasi masalah menggunakan notasi yang paling akrab bagi saya dan menganggap derivasi (kurang menarik, lebih rutin) mungkin bermanfaat untuk dimasukkan di sini.
Biarkan menjadi model regresi, untuk X ∈ R n × p dan ϵ noise. Kemudian regresi y terhadap kolom X memiliki persamaan normal X T ( y - X β ) = 0 , menghasilkan estimasi β = ( X T X ) - 1 X T y .y= Xβ∗+ ϵX∈ Rn × pϵyXXT( y- Xβ^) =0,
β^= ( XTX)- 1XTy.
Oleh karena itu regresi memiliki residual
untuk
H = X ( X T X ) - 1 X T .
r = y- Xβ^= ( Saya- H) y= ( Saya- H) ϵ ,
H= X( XTX)- 1XT
Kemunduran pada r hasil dalam perkiraan kemiringan yang diberikan oleh
( r T r ) - 1 r T εϵr
karenaI-Hsimetris dan idempoten danϵ∉im(X)hampir pasti.
( rTr )- 1rTϵ= ( [ ( Saya- H) ϵ ]T[ ( Saya- H) ϵ ] )- 1[ ( Saya- H) ϵ ]Tϵ= ϵT( Saya- H)TϵϵT( Saya- H)T( Saya- H) ϵ= ϵT( Saya- H) ϵϵT( Saya- H) ϵ= 1 ,
saya- Hϵ ∉ i m ( X)
Lebih lanjut, argumen ini juga berlaku jika kita memasukkan intersep ketika kita melakukan regresi kesalahan pada residu jika intersep dimasukkan dalam regresi asli, karena kovariat bersifat ortogonal (yaitu , dari persamaan normal) .1Tr = 0
lm(y~r)
,lm(e~r)
, danlm(r~r)
, yang karena itu semua harus sama. Yang terakhir jelas adalah . Coba ketiga perintah ini untuk melihat. Untuk membuat yang terakhir berfungsi di Anda harus membuat salinan , seperti . Untuk selengkapnya tentang diagram geometri regresi, lihat stats.stackexchange.com/a/113207 .R
r
s<-r;lm(r~s)