Saya menggunakan dukungan vektor regresi untuk memodelkan beberapa data yang cukup miring (dengan kurtosis tinggi). Saya sudah mencoba memodelkan data secara langsung tetapi saya mendapatkan prediksi yang salah, saya pikir terutama karena distribusi data, yang condong ke kanan dengan ekor yang sangat gemuk. Saya cukup yakin beberapa outlier (yang merupakan titik data yang sah) mempengaruhi pelatihan SVR, dan mungkin juga dalam validasi silang, di mana saat ini saya mengoptimalkan hyperparameters dengan meminimalkan kesalahan mean-squared.
Saya telah mencoba untuk mengukur data saya sebelum menerapkan SVR (misalnya menggunakan fungsi sqrt untuk mengurangi outlier) serta menggunakan fungsi minimisasi hyperparameter yang berbeda (misalnya kesalahan absolut), yang tampaknya memberikan hasil yang lebih baik, tetapi masih belum terlalu baik. Saya ingin tahu apakah ada yang mengalami masalah yang sama dan bagaimana mereka mendekatinya? Ada saran dan / atau metode alternatif yang paling disukai.