Sebenarnya mungkin untuk mendapatkan probabilitas dari Mesin Vector Support, yang mungkin lebih berguna dan dapat ditafsirkan daripada nilai "skor" sewenang-wenang. Ada beberapa pendekatan untuk melakukan ini: satu tempat yang masuk akal untuk memulai adalah Platt (1999) .
Sebagian besar paket / pustaka SVM mengimplementasikan sesuatu seperti ini (misalnya, opsi -b 1 menyebabkan LibSVM menghasilkan probabilitas). Jika Anda ingin memutar sendiri, Anda harus menyadari bahwa ada beberapa masalah numerik potensial, yang dirangkum dalam catatan ini oleh Lin, Lin, dan Weng (2007) . Mereka juga menyediakan beberapa psuedocode, yang mungkin juga membantu.
Edit dalam menanggapi komentar Anda : Agak tidak jelas bagi saya mengapa Anda lebih suka skor daripada probabilitas, terutama karena Anda bisa mendapatkan probabilitas dengan upaya ekstra minimal. Semua yang dikatakan, sebagian besar perhitungan probabilitas sepertinya berasal dari jarak antara titik dan hyperplane. Jika Anda melihat Bagian 2 dari makalah Platt, ia berjalan melalui motivasi dan berkata:
Kerapatan bersyarat kelas antara margin tampaknya eksponensial. Aturan Bayes pada dua eksponensial menyarankan menggunakan bentuk parametrik dari sigmoid:
Model sigmoid ini setara dengan asumsi bahwa output SVM sebanding dengan log-kemungkinan contoh pelatihan positif. [MK: didefinisikan di tempat lain sebagai output SVM mentah].
P(y=1|f)=11+exp(Af+B)
f
Sisa dari bagian metode menjelaskan bagaimana menyesuaikan parameter dan dari sigmoid itu. Dalam pengantar (Bagian 1.0 dan 1.1), Platt mengulas beberapa pendekatan lain oleh Vapnik, Wahba, dan Hasti & Tibshirani. Metode ini juga menggunakan sesuatu seperti jarak ke hyperplane, dimanipulasi dengan berbagai cara. Ini semua tampaknya menunjukkan bahwa jarak ke hyperplane berisi beberapa informasi yang berguna, jadi saya kira Anda bisa menggunakan jarak mentah karena beberapa ukuran kepercayaan (non-linear).AB