Sangat tepat untuk menggunakan aturan penilaian yang tidak tepat ketika tujuannya sebenarnya adalah perkiraan, tetapi bukan inferensi. Saya tidak terlalu peduli apakah peramal lain curang atau tidak ketika saya yang akan melakukan ramalan.
Aturan penilaian yang tepat memastikan bahwa selama proses estimasi model mendekati proses pembuatan data yang sebenarnya (DGP). Ini kedengarannya menjanjikan karena ketika kita mendekati DGP yang sebenarnya, kita juga akan melakukan hal yang baik dalam hal perkiraan di bawah fungsi kerugian. Tangkapannya adalah sebagian besar waktu (sebenarnya dalam kenyataannya hampir selalu) ruang pencarian model kami tidak mengandung DGP yang sebenarnya. Kami akhirnya mendekati DGP yang sebenarnya dengan beberapa bentuk fungsional yang kami usulkan.
Dalam pengaturan yang lebih realistis ini, jika tugas perkiraan kami lebih mudah daripada mengetahui seluruh kepadatan DGP yang sebenarnya, kami sebenarnya dapat melakukan lebih baik. Ini terutama berlaku untuk klasifikasi. Misalnya DGP yang sebenarnya bisa sangat kompleks tetapi tugas klasifikasi bisa sangat mudah.
Yaroslav Bulatov memberikan contoh berikut di blognya:
http://yaroslavvb.blogspot.ro/2007/06/log-loss-or-hinge-loss.html
x ≥ 0x < 0
Alih-alih mencocokkan kepadatan tepat di atas, kami mengusulkan model minyak mentah di bawah ini, yang cukup jauh dari DGP yang sebenarnya. Namun itu klasifikasi sempurna. Ini ditemukan dengan menggunakan kehilangan engsel, yang tidak tepat.
Di sisi lain jika Anda memutuskan untuk menemukan DGP yang benar dengan log-loss (yang tepat) maka Anda mulai memasang beberapa fungsional, karena Anda tidak tahu apa bentuk fungsional yang tepat yang Anda butuhkan apriori. Tetapi ketika Anda berusaha semakin keras untuk mencocokkannya, Anda mulai mengklasifikasikan hal-hal yang salah.
Perhatikan bahwa dalam kedua kasus kami menggunakan bentuk fungsional yang sama. Dalam kasus kerugian yang tidak tepat, fungsi itu merosot menjadi fungsi langkah yang pada gilirannya melakukan klasifikasi sempurna. Dalam kasus yang tepat ia mengamuk mencoba memuaskan setiap wilayah kepadatan.
Pada dasarnya kita tidak selalu perlu mencapai model yang benar untuk memiliki perkiraan yang akurat. Atau kadang-kadang kita tidak benar-benar perlu berbuat baik pada seluruh domain kepadatan, tetapi menjadi sangat baik hanya pada bagian tertentu saja.