Trade-off varians bias didasarkan pada pemecahan galat kuadrat rata-rata:
MSE(y^)=E[y−y^]2=E[y−E[y^]]2+E[y^−E[y^]]2
Salah satu cara untuk melihat perdagangan bias-varians adalah properti apa dari set data yang digunakan dalam model fit. Untuk model sederhana, jika kita mengasumsikan bahwa regresi OLS digunakan agar sesuai dengan garis lurus, maka hanya 4 angka yang digunakan agar sesuai dengan garis:
- Sampel kovarians antara x dan y
- Varians sampel x
- Rata-rata sampel x
- Rata-rata sampel y
Jadi, setiap grafik yang mengarah ke 4 angka yang sama di atas akan mengarah ke garis pas yang sama persis (10 poin, 100 poin, 100000000 poin). Jadi dalam arti itu tidak sensitif terhadap sampel tertentu yang diamati. Ini berarti akan "bias" karena secara efektif mengabaikan bagian dari data. Jika bagian data yang diabaikan itu penting, maka prediksi akan secara konsisten salah. Anda akan melihat ini jika Anda membandingkan garis yang dipasang menggunakan semua data dengan garis yang dipasang yang diperoleh dari menghapus satu titik data. Mereka akan cenderung cukup stabil.
Sekarang model kedua menggunakan setiap memo data yang bisa didapat, dan cocok dengan data sedekat mungkin. Oleh karena itu, posisi yang tepat dari setiap titik data penting, sehingga Anda tidak dapat menggeser data pelatihan tanpa mengubah model yang pas seperti yang Anda bisa untuk OLS. Dengan demikian model ini sangat sensitif terhadap set pelatihan tertentu yang Anda miliki. Model yang dipasang akan sangat berbeda jika Anda melakukan plot titik data drop-one yang sama.