Misalkan saya tertarik dalam tiga kelas , , . Tetapi dataset saya sebenarnya mengandung beberapa kelas nyata .c 2 c 3 ( c j ) n j = 4
Jawaban yang jelas adalah mendefinisikan kelas baru yang merujuk ke semua kelas , tetapi saya menduga ini bukan ide yang baik karena sampel dalam akan langka dan tidak sangat mirip satu sama lain.cjj>3 c 4
Untuk memvisualisasikan apa yang saya katakan, kira saya memiliki berikut dua ruang variabel dan kelas , , , digambarkan dalam warna merah, til, hijau dan hitam masing-masing. Ini adalah bagaimana saya menduga data saya akan terlihat seperti.c 2 c 3 c 4 = ⋃ n j = 4 c j
Apakah ada cara standar untuk mendekati masalah ini? Apa yang akan menjadi pengklasifikasi paling efisien dan mengapa?