Menurut dokumentasi objek StandardScaler di scikit-learn:
Misalnya banyak elemen yang digunakan dalam fungsi objektif dari algoritma pembelajaran (seperti kernel RBF dari Support Vector Machines atau L1 dan L2 regularizer model linier) mengasumsikan bahwa semua fitur berpusat di sekitar 0 dan memiliki varian dalam urutan yang sama. Jika suatu fitur memiliki varians yang urutan besarnya lebih besar dari yang lain, itu mungkin mendominasi fungsi objektif dan membuat estimator tidak dapat belajar dari fitur lain dengan benar seperti yang diharapkan.
Saya harus mengukur fitur saya sebelum klasifikasi. Apakah ada cara mudah untuk menunjukkan mengapa saya harus melakukan ini? Referensi ke artikel ilmiah akan lebih baik. Saya sudah menemukan satu tetapi mungkin ada banyak lainnya.