Saya akan mengatakan, pilihannya sangat tergantung pada data apa yang Anda miliki dan apa tujuan Anda. Beberapa "aturan praktis".
Random Forest secara intrinsik cocok untuk masalah multi-kelas, sedangkan SVM secara intrinsik adalah dua kelas. Untuk masalah multikelas, Anda perlu menguranginya menjadi beberapa masalah klasifikasi biner.
Random Forest berfungsi dengan baik dengan campuran fitur numerik dan kategoris. Ketika fitur berada di berbagai skala, itu juga baik-baik saja. Secara kasar, dengan Random Forest Anda dapat menggunakan data apa adanya. SVM memaksimalkan "margin" dan dengan demikian bergantung pada konsep "jarak" antara titik yang berbeda. Terserah Anda untuk memutuskan apakah "jarak" itu bermakna. Sebagai akibatnya, pengodean satu-panas untuk fitur-fitur kategorikal adalah suatu keharusan. Lebih lanjut, penskalaan minimal atau penskalaan lainnya sangat disarankan pada langkah preprosesing.
nmn × nn2
Untuk masalah klasifikasi, Random Forest memberi Anda kemungkinan memiliki kelas. SVM memberi Anda jarak ke batas, Anda masih perlu mengubahnya menjadi probabilitas entah bagaimana jika Anda membutuhkan probabilitas.
Untuk masalah-masalah tersebut, di mana SVM berlaku, umumnya berkinerja lebih baik daripada Hutan Acak.
SVM memberi Anda "vektor dukungan", yaitu titik di setiap kelas yang paling dekat dengan batas antar kelas. Mereka mungkin tertarik untuk interpretasi.