Saya belajar klasifikasi SVM dan menemui masalah. Saya tidak yakin apakah dilema ini memiliki terminologi untuk itu.
Asumsikan kami ingin mengklasifikasikan pasien berdasarkan SVM dengan memberikan sampel orang sehat (baik jenis kelamin) dan orang dengan kanker hati (baik jenis kelamin). Jika kita memberi label sampel orang sehat sebagai kelas 1 dan penderita kanker sebagai kelas 2, kita bisa melatih SVM biner dan mendapatkan classifier 1 untuk memprediksi pasien baru. Sekarang, gambar skenario lain. Asumsikan bahwa kita membagi semua sampel berdasarkan jenis kelamin sebelum klasifikasi SVM. Untuk setiap jenis kelamin, kami masih memberi label pasien sehat vs pasien kanker menjadi 2 kelas dan melatih SVM biner untuk mendapatkan classifier 2 dan classifier 3 untuk sampel wanita dan pria masing-masing. Pertanyaannya adalah apakah ada pasien wanita baru, yang mana classifier, 1 atau 2, harus digunakan untuk mendapatkan prediksi yang lebih akurat? Inilah dilema untuk argumen yang saya miliki
(1) Ketika jumlah sampel besar, prediksi harus lebih akurat. Berdasarkan argumen ini, classifier 1 tampaknya merupakan pilihan yang baik.
(2) Namun, jika kita membagi sampel menjadi kelompok perempuan dan laki-laki terlebih dahulu, penggolong 2 tampaknya merupakan pilihan yang lebih baik karena pasien baru (sampel uji yang tidak diketahui) adalah perempuan.
Apakah dilema semacam ini memiliki terminologi atau ada yang tahu informasi lebih lanjut atau bagaimana menyelesaikan masalah seperti ini? Saya bahkan tidak yakin apakah ini pertanyaan yang sah dan maaf atas pertanyaan naif sebelumnya. Terima kasih