Perbedaan antara ep-SVR dan nu-SVR (dan kuadrat terkecil SVR)


11

Saya mencoba mencari tahu SVR mana yang cocok untuk data seperti itu.

Saya tahu 4 jenis SVR:

  • epsilon
  • nu
  • kuadrat terkecil dan
  • linier.

Saya mengerti linear SVR kurang lebih seperti laso dengan L1 Reg, Tapi apa perbedaan antara 3 teknik yang tersisa?

Jawaban:


11

Dalam -SVR, parameter digunakan untuk menentukan proporsi jumlah vektor dukungan yang ingin Anda simpan dalam solusi Anda sehubungan dengan jumlah total sampel dalam dataset. Dalam -SVR parameter dimasukkan ke dalam formulasi masalah optimisasi dan diperkirakan secara otomatis (optimal) untuk Anda.ν ν ϵνννϵ

Namun, dalam -SVR Anda tidak memiliki kontrol pada berapa banyak vektor data dari dataset menjadi vektor pendukung, bisa beberapa, bisa banyak. Meskipun demikian, Anda akan memiliki kontrol total dari berapa banyak kesalahan yang Anda akan memungkinkan untuk memiliki model Anda, dan segala sesuatu di luar ditentukan akan dikenakan sanksi sebanding dengan , yang merupakan parameter regularisasi.ϵ CϵϵC

Tergantung dari apa yang saya inginkan, saya memilih di antara keduanya. Jika saya benar-benar putus asa untuk solusi kecil (vektor dukungan lebih sedikit) saya memilih -SVR dan berharap untuk mendapatkan model yang layak. Tetapi jika saya benar-benar ingin mengendalikan jumlah kesalahan dalam model saya dan mencari kinerja terbaik, saya memilih -SVR dan berharap bahwa modelnya tidak terlalu rumit (banyak vektor dukungan).ϵνϵ


5

Perbedaan antara -SVR dan -SVR adalah bagaimana masalah pelatihan parametrized. Keduanya menggunakan jenis kehilangan engsel dalam fungsi biaya. The parameter dalam -SVM dapat digunakan untuk mengontrol jumlah vektor dukungan dalam model yang dihasilkan. Dengan parameter yang sesuai, masalah yang sama persis terpecahkan. 1ν ν νϵννν

Kuadrat terkecil SVR berbeda dari dua lainnya dengan menggunakan residu kuadrat dalam fungsi biaya daripada kerugian engsel.

1 : C.-C. Chang dan C.-J. Lin Pelatihan - mendukung vektor regresi: Teori dan algoritmaν . Neural Computation, 14 (8): 1959-1977, 2002.


Terima kasih atas jawaban Anda, Marc. Jadi bisakah kita membedakan metode yang sesuai berdasarkan dataset yang kita miliki? Jika demikian, dapatkah Anda memberi saya beberapa petunjuk? Saya memiliki 40000 sampel dengan 200 output berbeda. Jadi dapat dianggap sebagai 200 set dari 200 sampel unik. Input untuk semua 40000 berbeda, hanya outputnya unik untuk 200 sampel.
Sharath Chandra

0

Saya suka jawaban Pablo dan Marc. Satu poin tambahan:

Dalam makalah yang dikutip oleh Marc ada tertulis (bagian 4)

"Motivasi -SVR adalah bahwa mungkin tidak mudah untuk menentukan parameter . Oleh karena itu, di sini kami tertarik pada kisaran yang mungkin dari . Seperti yang diharapkan, hasil menunjukkan bahwa terkait dengan nilai target .νϵϵϵy

[...]

Karena rentang efektif dari dipengaruhi oleh nilai target , cara untuk mengatasi kesulitan ini untuk -SVM adalah dengan menskalakan nilai target sebelum melatih data. Misalnya, jika semua nilai target diskalakan ke , maka rentang efektif dari adalah , sama dengan . Maka mungkin lebih mudah untuk memilih . "ϵyϵ[1,+1]ϵ[0,1]νϵ

Itu membuat saya berpikir bahwa seharusnya lebih mudah untuk mengukur variabel target Anda dan menggunakan -SVR, daripada mencoba memutuskan apakah akan menggunakan atau SVR.ϵϵν

Bagaimana menurut anda?

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.