Saya pikir itu bisa dibuat lebih jelas melalui contoh. Katakanlah Anda memiliki dua vektor input: X1 dan X2. dan katakanlah X1 memiliki rentang (0,1 hingga 0,8) dan X2 memiliki kisaran (3000 hingga 50000). Sekarang classifier SVM Anda akan menjadi batas linear yang terletak di bidang X1-X2. Klaim saya adalah bahwa kemiringan batas keputusan linier tidak harus bergantung pada kisaran X1 dan X2, tetapi pada distribusi poin.
Sekarang mari kita membuat prediksi pada titik (0,1, 4000) dan (0,8, 4000). Hampir tidak ada perbedaan dalam nilai fungsi, sehingga membuat SVM kurang akurat karena akan memiliki sensitivitas yang lebih rendah terhadap titik-titik dalam arah X1.