Anda biasanya tidak dapat menguraikan kesalahan (residual) menjadi komponen bias dan varians. Alasan sederhana adalah bahwa Anda umumnya tidak tahu fungsi sebenarnya. Ingat bahwa dan bahwa f ( x ) adalah hal yang tidak diketahui Anda ingin memperkirakan.b i a s ( f^( x ) ) = E[ f^( x ) - f( x ) ] ,f( x )
Bagaimana dengan bootstrap?
Hal ini dimungkinkan untuk memperkirakan bias dari estimator oleh bootstrap, tapi itu bukan tentang model mengantongi, dan saya tidak percaya ada cara untuk menggunakan bootstrap untuk menilai bias dalam f ( x ) , karena bootstrap masih berdasarkan pada beberapa gagasan tentang Kebenaran dan tidak bisa, terlepas dari asal usul namanya, menciptakan sesuatu dari ketiadaan.f^( x ) ,
Untuk memperjelas: estimasi bootstrap bias dalam estimator θ adalah
^ b i a s B = θ * ( ⋅ ) - θ ,θ^
b i a sˆB= θ^∗( ⋅ ) - θ^,
dengan θ * ( ⋅ ) menjadi rata-rata statistik Anda dihitung B sampel bootstrap . Proses ini mengemulasi pengambilan sampel dari beberapa populasi dan menghitung jumlah yang Anda minati. Ini hanya bekerja jika θ pada prinsipnya bisa dihitung langsung dari populasi. Perkiraan bootstrap dari bias menilai apakah estimasi plug-in - yaitu hanya membuat perhitungan yang sama pada sampel dan bukan dalam populasi - bias.θ^∗( ⋅ )B θ^
Jika Anda hanya ingin menggunakan residu Anda untuk mengevaluasi kecocokan model, itu sepenuhnya mungkin. Jika Anda, seperti yang Anda katakan di komentar, ingin membandingkan model bersarang dan f 2 ( x ) = 3 x 1 + 2 x 2 + x 1 x 2 , Anda dapat melakukan ANOVA untuk memeriksa apakah model yang lebih besar secara signifikan mengurangi jumlah kesalahan kuadrat.f1( x ) = 3 x1+ 2 x2f2( x ) = 3 x1+ 2 x2+ x1x2