Apa pendapat Anda tentang oversampling dalam klasifikasi secara umum, dan algoritma SMOTE pada khususnya? Mengapa kita tidak hanya menerapkan biaya / penalti untuk menyesuaikan ketidakseimbangan dalam data kelas dan biaya kesalahan yang tidak seimbang? Untuk tujuan saya, keakuratan prediksi untuk satu set unit eksperimental di masa depan adalah ukuran utama.
Untuk referensi, makalah SMOTE: http://www.jair.org/papers/paper953.html