Sebagai penjelasan alternatif, pertimbangkan intuisi berikut:
Saat meminimalkan kesalahan, kita harus memutuskan bagaimana cara menghukum kesalahan ini. Memang, pendekatan yang paling mudah untuk menghukum kesalahan adalah dengan menggunakan linearly proportional
fungsi penalti. Dengan fungsi seperti itu, setiap penyimpangan dari rata-rata diberi kesalahan yang sesuai secara proporsional. Oleh karena itu, dua kali jauh dari rata-rata akan menghasilkan dua kali penalti.
Pendekatan yang lebih umum adalah untuk mempertimbangkan squared proportional
hubungan antara penyimpangan dari rata-rata dan hukuman yang sesuai. Ini akan memastikan bahwa semakin jauh Anda dari rata-rata, semakin Anda akan dihukum secara proporsional . Dengan menggunakan fungsi penalti ini, outlier (jauh dari rata-rata) secara proporsional dianggap lebih informatif daripada pengamatan di dekat rata-rata.
Untuk memberikan visualisasi tentang hal ini, Anda dapat memplot fungsi penalti:
Sekarang terutama ketika mempertimbangkan estimasi regresi (misalnya OLS), fungsi penalti yang berbeda akan menghasilkan hasil yang berbeda. Dengan menggunakan linearly proportional
fungsi penalti, regresi akan menetapkan bobot yang lebih kecil untuk pencilan daripada saat menggunakan squared proportional
fungsi penalti. Median Absolute Deviation (MAD) dikenal sebagai penduga yang lebih kuat . Secara umum, oleh karena itu kasus bahwa estimator yang kuat cocok dengan sebagian besar poin data dengan baik tetapi 'mengabaikan' outlier. Sebagai perbandingan, kuadrat yang paling cocok ditarik lebih ke arah outlier. Berikut ini visualisasi untuk perbandingan:
Sekarang meskipun OLS cukup standar, fungsi penalti yang berbeda pasti digunakan juga. Sebagai contoh, Anda dapat melihat fungsi robustfit Matlab yang memungkinkan Anda untuk memilih fungsi penalti yang berbeda (juga disebut 'bobot') untuk regresi Anda. Fungsi penalti termasuk andrews, bisquare, cauchy, fair, huber, logistik, ols, talwar dan welsch. Ekspresi yang sesuai dapat ditemukan di situs web juga.
Saya harap ini membantu Anda mendapatkan sedikit intuisi untuk fungsi penalti :)
Memperbarui
Jika Anda memiliki Matlab, saya dapat merekomendasikan bermain dengan Matlab's robustdemo , yang dibangun khusus untuk perbandingan kuadrat terkecil biasa dengan regresi kuat:
Demo ini memungkinkan Anda untuk menarik poin individual dan segera melihat dampaknya pada kuadrat terkecil biasa dan regresi kuat (yang sempurna untuk tujuan pengajaran!).