Tautan yang Anda poskan memiliki banyak teknik yang saya sarankan, tetapi juga memplot kurva belajar dapat membantu. Ini dapat membantu Anda melihat tidak hanya kinerja absolut, tetapi dapat membantu Anda memahami seberapa jauh dari kinerja optimal Anda.
Kurva Belajar: Jika Anda merencanakan kesalahan validasi silang (cv) dan tingkat kesalahan set pelatihan versus ukuran set pelatihan, Anda bisa belajar banyak. Jika kedua kurva saling mendekati dengan tingkat kesalahan rendah, maka Anda baik-baik saja.
Jika sepertinya kurva mulai mendekati satu sama lain dan keduanya mengarah / tetap rendah, maka Anda memerlukan lebih banyak data.
Jika kurva cv tetap tinggi, tetapi kurva set latihan tetap rendah, maka Anda memiliki situasi varians tinggi. Anda bisa mendapatkan lebih banyak data, atau menggunakan regularisasi untuk meningkatkan generalisasi.
Jika cv tetap tinggi dan kurva set latihan muncul untuk memenuhi itu, maka Anda memiliki bias tinggi. Dalam hal ini, Anda ingin menambahkan detail ke model Anda.