Dataset yang tidak seimbang adalah masalah umum di semua bidang dan tidak secara khusus menyangkut visi komputer dan masalah yang ditangani oleh Convolutional Neural Networks (CNNs).
Untuk mengatasi masalah ini, Anda harus mencoba menyeimbangkan dataset Anda, baik dengan over-sampling kelas minoritas atau kelas mayoritas under-sampling (atau keduanya). Arguably, pilihan yang baik adalah algoritma SMOTE (Synthetic Minority Over-sampling Technique), seperti yang disebutkan di atas. Di sini Anda dapat menemukan perbandingan berbagai algoritma pengambilan sampel berlebih. Jika Anda pengguna Python, ketidakseimbangan-belajar adalah perpustakaan yang bagus yang menerapkan banyak teknik yang berguna untuk menyeimbangkan dataset.
Di sisi lain, jika Anda mencoba untuk mengklasifikasikan gambar, cara yang bagus untuk meningkatkan ukuran dataset Anda adalah dengan menambahkannya (yaitu dengan membuat contoh sintetis yang masuk akal, misalnya gambar yang serupa tetapi diputar / digeser sedikit sehubungan dengan yang asli). Terkadang Anda mungkin perlu menambah kelas minoritas untuk mencapai keseimbangan yang lebih baik. Keras ImageDataGenerator kelas adalah alat yang bagus untuk tujuan ini.