Singkatnya, singkatnya, berarti memperhitungkan terlalu banyak informasi dari data Anda dan / atau pengetahuan sebelumnya, dan menggunakannya dalam model. Untuk membuatnya lebih mudah, pertimbangkan contoh berikut: Anda disewa oleh beberapa ilmuwan untuk memberi mereka model untuk memprediksi pertumbuhan beberapa jenis tanaman. Para ilmuwan telah memberi Anda informasi yang dikumpulkan dari pekerjaan mereka dengan tanaman semacam itu sepanjang tahun, dan mereka akan terus memberi Anda informasi tentang pengembangan perkebunan mereka di masa depan.
Jadi, Anda menjalankan melalui data yang diterima, dan membangun model dari itu. Sekarang anggaplah bahwa, dalam model Anda, Anda mempertimbangkan sebanyak mungkin karakteristik untuk selalu mengetahui perilaku yang tepat dari tanaman yang Anda lihat dalam dataset awal. Sekarang, ketika produksi berlanjut, Anda akan selalu mempertimbangkan karakteristik itu, dan akan menghasilkan hasil yang sangat halus . Namun, jika perkebunan akhirnya mengalami beberapa perubahan musiman, hasil yang Anda terima mungkin sesuai dengan model Anda sedemikian rupa sehingga prediksi Anda akan mulai gagal (baik mengatakan bahwa pertumbuhan akan melambat, sementara itu sebenarnya akan mempercepat, atau sebaliknya).
Selain tidak dapat mendeteksi variasi kecil seperti itu, dan biasanya mengklasifikasikan entri Anda secara tidak benar, fine-grain pada model, yaitu jumlah variabel yang besar, dapat menyebabkan pemrosesan menjadi terlalu mahal. Sekarang, bayangkan data Anda sudah kompleks. Melengkapi model Anda dengan data tidak hanya akan membuat klasifikasi / evaluasi menjadi sangat kompleks, tetapi kemungkinan besar akan membuat Anda keliru dalam memprediksi variasi terkecil yang Anda miliki pada input.
Sunting : Ini mungkin juga bermanfaat, mungkin menambahkan dinamika pada penjelasan di atas: D