Saya memiliki dataset yang memiliki atribut kelas biner. Ada 623 contoh dengan kelas +1 (kanker positif) dan 101.671 contoh dengan kelas -1 (kanker negatif).
Saya telah mencoba berbagai algoritma (Naif Bayes, Random Forest, AODE, C4.5) dan semuanya memiliki rasio negatif palsu yang tidak dapat diterima. Random Forest memiliki akurasi prediksi keseluruhan tertinggi (99,5%) dan rasio negatif palsu terendah, tetapi masih merindukan 79% dari kelas positif (yaitu gagal mendeteksi 79% tumor ganas).
Adakah ide bagaimana saya dapat memperbaiki situasi ini?
Terima kasih!