Overfitting tidak hanya ketika kesalahan pengujian meningkat seiring iterasi. Kami mengatakan bahwa ada overfitting ketika kinerja di set tes jauh lebih rendah daripada kinerja di set kereta api (karena modelnya terlalu banyak cocok untuk data yang terlihat, dan tidak menggeneralisasi dengan baik).
Dalam plot kedua Anda, kita dapat melihat bahwa pertunjukan di set tes hampir 10 kali lebih rendah dari kinerja di set kereta, yang dapat dianggap sebagai overfitting.
Hampir selalu merupakan kasus bahwa sebuah model berkinerja lebih baik di set pelatihan daripada set tes, karena model sudah melihat data. Namun, model yang baik harus bisa menggeneralisasi data yang tidak terlihat dengan baik, dan kemudian mengurangi kesenjangan antara kinerja di kereta dan set tes.
Contoh overfitting pertama Anda dapat dipecahkan dengan menghentikan lebih awal misalnya. Contoh kedua Anda dapat diselesaikan dengan regularisasi, dengan merusak input, dll.