Ini adalah pertanyaan secara umum, tidak spesifik untuk metode atau kumpulan data apa pun. Bagaimana kita menangani masalah ketidakseimbangan kelas dalam pembelajaran Supervised Machine di mana angka 0 adalah sekitar 90% dan angka 1 adalah sekitar 10% dalam dataset Anda. Bagaimana kita melatih penggolong secara optimal.
Salah satu cara yang saya ikuti adalah sampling untuk membuat dataset seimbang dan kemudian melatih classifier dan ulangi ini untuk beberapa sampel.
Saya merasa ini acak, Apakah ada kerangka kerja untuk mendekati masalah semacam ini.