Illustrating the Bias - Variance Tradeoff menggunakan contoh mainan
Seperti yang ditunjukkan oleh @Matthew Drury, dalam situasi realistis Anda tidak dapat melihat grafik terakhir, tetapi contoh mainan berikut ini dapat memberikan interpretasi visual dan intuisi kepada mereka yang merasa terbantu.
Kumpulan data dan asumsi
Y
- Y= s i n ( πx - 0,5 ) + ϵϵ ∼ Udan aku fo r m ( - 0,5 , 0,5 )
- Y= f( x ) + ϵ
xYVa r ( Y) = Va r ( ϵ ) = 112
f^( x ) = β0+ β1x + β1x2+ . . . + βhalxhal
Pas berbagai model polinomial
Secara intuitif, Anda akan mengharapkan kurva garis lurus berkinerja buruk karena dataset jelas tidak linier. Demikian pula, pemasangan polinomial orde sangat tinggi mungkin berlebihan. Intuisi ini tercermin dalam grafik di bawah ini yang menunjukkan berbagai model dan Mean Square Error terkait untuk data kereta dan uji.
Grafik di atas berfungsi untuk satu train / split tes tetapi bagaimana kita tahu apakah itu digeneralisasikan?
Memperkirakan kereta yang diharapkan dan menguji MSE
Di sini kami memiliki banyak pilihan, tetapi satu pendekatan adalah membagi data secara acak antara kereta / uji - paskan model pada split yang diberikan, dan ulangi percobaan ini berkali-kali. MSE yang dihasilkan dapat diplot dan rata-rata adalah perkiraan kesalahan yang diharapkan.
Sangat menarik untuk melihat bahwa tes MSE berfluktuasi liar untuk perbedaan data kereta / tes. Tetapi mengambil rata-rata pada sejumlah besar percobaan cukup memberi kita kepercayaan diri yang lebih baik.
Y
Bias - Dekomposisi Varian
Seperti dijelaskan di sini , MSE dapat dipecah menjadi 3 komponen utama:
E[ ( Y- f^)2] = σ2ϵ+ B i a s2[ f^] + Va r [ f^]
E[ ( Y- f^)2] = σ2ϵ+ [ f- E[ f^] ]2+ E[ f^- E[ f^] ]2
Di mana dalam kotak mainan kami:
- f
- σ2ϵϵ
- E[ f^] dapat dihitung seperti di atas
- f^ sesuai dengan garis berwarna terang
- E[ f^- E[ f^] ]2 dapat diperkirakan dengan mengambil rata-rata
Memberi relasi berikut
Catatan: grafik di atas menggunakan data pelatihan agar sesuai dengan model dan kemudian menghitung MSE pada tes kereta + .