Saya baru mengenal pembelajaran mesin dan mencoba menggunakan scikit-learning (sklearn) untuk menangani masalah klasifikasi. Baik DecisionTree dan SVM dapat melatih classifier untuk masalah ini.
Saya menggunakan sklearn.ensemble.RandomForestClassifier
dan sklearn.svm.SVC
menyesuaikan data pelatihan yang sama (sekitar 500.000 entri dengan 50 fitur per entri). The RandomForestClassifier keluar dengan classifier di sekitar satu menit. The SVC menggunakan lebih dari 24 jam dan masih terus berjalan.
Mengapa SVC berkinerja sangat tidak efisien? Apakah set data terlalu besar untuk SVC ? Apakah SVC tidak tepat untuk masalah seperti itu?