Mungkin: waspadalah. Ketika Anda mengatakan bahwa akurasi 70% (namun Anda mengukurnya) cukup baik untuk Anda, rasanya seperti Anda mengasumsikan bahwa kesalahan didistribusikan secara acak atau merata.
Tetapi salah satu cara untuk melihat overfitting adalah bahwa hal itu terjadi ketika teknik model memungkinkan (dan proses pelatihannya mendorong) memberikan terlalu banyak perhatian pada kebiasaan dalam set pelatihan. Subjek dalam populasi umum yang berbagi kebiasaan ini mungkin memiliki hasil yang sangat tidak seimbang.
Jadi mungkin Anda berakhir dengan model yang mengatakan semua anjing merah menderita kanker - karena kekhasan khusus dalam data pelatihan Anda. Atau bahwa orang yang menikah antara usia 24 dan 26 hampir dijamin untuk mengajukan klaim asuransi penipuan. Akurasi 70% Anda menyisakan banyak ruang untuk kantong subjek menjadi 100% salah karena model Anda terlalu bagus.
(Tidak berpakaian berlebihan bukan jaminan bahwa Anda tidak akan memiliki kantong prediksi yang salah. Bahkan model yang kurang fit akan memiliki petak prediksi buruk, tetapi dengan overfitting Anda tahu bahwa Anda memperbesar efek quirks dalam data pelatihan Anda. .)