Selain itu karakteristik classifier jelas seperti
- biaya komputasi,
- tipe data yang diharapkan dari fitur / label dan
- kesesuaian untuk ukuran dan dimensi set data tertentu,
apa lima (atau 10, 20?) pengklasifikasi teratas untuk dicoba pertama kali pada kumpulan data baru yang belum diketahui banyak orang (mis. semantik dan korelasi fitur individual)? Biasanya saya mencoba Naive Bayes, Nearest Neighbor, Decision Tree dan SVM - meskipun saya tidak memiliki alasan yang baik untuk pemilihan ini selain saya mengenal mereka dan kebanyakan mengerti bagaimana mereka bekerja.
Saya kira kita harus memilih pengklasifikasi yang mencakup pendekatan klasifikasi umum yang paling penting . Pilihan mana yang akan Anda rekomendasikan, sesuai dengan kriteria itu atau karena alasan lain?
PEMBARUAN: Formulasi alternatif untuk pertanyaan ini bisa berupa: "Pendekatan umum apa yang ada untuk klasifikasi dan metode spesifik mana yang paling penting / populer / menjanjikan?"