Hubungan antara dan adalah:ε^ε
ε^=(I−H)ε
di mana , matriks topi, adalah .HX(XTX)−1XT
Yang mengatakan bahwa adalah kombinasi linear dari semua kesalahan, tetapi biasanya sebagian besar bobot jatuh pada yang ke- .ε^ii
Berikut ini contoh, menggunakan cars
kumpulan data dalam R. Pertimbangkan titik bertanda ungu:
Sebut saja titik . Sisanya, , di mana untuk kesalahan lain berada di wilayah -0,02:iε^i≈0.98εi+∑j≠iwjεjwj
Kita dapat menulis ulang itu sebagai:
ε^i≈0.98εi+ηi
atau lebih umum
ε^i=(1−hii)εi+ηi
di mana adalah th elemen diagonal dari . Demikian pula, di atas adalah . i H w j h i jhiiiHwjhij
Jika kesalahan adalah iid maka dalam contoh ini, jumlah tertimbang dari kesalahan-kesalahan lain akan memiliki standar deviasi yang sesuai dengan sekitar 1/7 efek dari kesalahan pengamatan ke- pada residunya. .iN(0,σ2)i
Yang mengatakan, dalam regresi berperilaku baik, residu sebagian besar dapat diperlakukan seperti perkiraan yang cukup berisik dari tidak dapat diamati istilah kesalahan. Ketika kami mempertimbangkan poin lebih jauh dari pusat, hal-hal bekerja agak kurang baik (residu menjadi kurang tertimbang pada kesalahan dan bobot pada kesalahan lainnya menjadi lebih merata).
Dengan banyak parameter, atau dengan tidak terdistribusi dengan baik, residu mungkin jauh lebih sedikit seperti kesalahan. Anda mungkin ingin mencoba beberapa contoh.X