Anda benar-benar menemukan sesuatu pertanyaan terbuka dalam literatur. Seperti yang Anda katakan, ada berbagai kernel (misalnya, linier, fungsi basis radial, sigmoid, polinomial), dan akan melakukan tugas klasifikasi Anda dalam ruang yang ditentukan oleh persamaan masing-masing. Sepengetahuan saya, tidak ada yang secara definitif menunjukkan bahwa satu kernel selalu berkinerja terbaik pada satu jenis tugas klasifikasi teks dibandingkan yang lain.
Satu hal yang perlu dipertimbangkan adalah bahwa setiap fungsi kernel memiliki 1 atau lebih parameter yang perlu dioptimalkan untuk set data Anda, yang berarti, jika Anda melakukannya dengan benar, Anda harus memiliki koleksi pelatihan hold-out kedua di mana Anda dapat selidiki nilai terbaik untuk parameter ini. (Saya katakan koleksi hold-out kedua, karena Anda seharusnya sudah memiliki satu yang Anda gunakan untuk mengetahui fitur input terbaik untuk classifier Anda.) Saya melakukan percobaan beberapa waktu lalu di mana saya melakukan optimasi skala besar dari masing-masing parameter-parameter ini untuk tugas klasifikasi tekstual sederhana dan menemukan bahwa setiap kernel tampaknya berkinerja cukup baik, tetapi melakukannya pada konfigurasi yang berbeda. Jika saya mengingat hasil saya dengan benar, sigmoid melakukan yang terbaik, tetapi melakukannya pada penyetelan parameter yang sangat spesifik - yang membutuhkan waktu lebih dari sebulan untuk ditemukan mesin saya.