Lihat bagian 2.3.2 dari makalah ini oleh Chapelle dan Zien. Mereka memiliki heuristik yang bagus untuk memilih rentang pencarian yang baik untuk dari kernel RBF dan C untuk SVM. Saya mengutipσC
Untuk menentukan nilai bagus dari parameter bebas yang tersisa (mis. Oleh CV), penting untuk mencari pada skala yang tepat. Karena itu kami memperbaiki nilai default untuk dan σ yang memiliki urutan besarnya yang benar. Dalam c masalah-kelas kita menggunakan 1 / c kuantil dari jarak berpasangan D ρ i j dari semua data-poin sebagai default untuk σ . Default untuk C adalah invers dari varians empiris s 2 dalam ruang fitur, yang dapat dihitung dengan s 2 = 1Cσc1/cDρijσCs2
darin×nkernel matriksK.s2=1n∑iKii−1n2∑i,jKijn×nK
Setelah itu, mereka menggunakan kelipatan (misalnya untuk k ∈ { - 2 , . . . , 2 } ) dari nilai default sebagai rentang pencarian dalam kotak-pencarian menggunakan cross-validasi. Itu selalu berhasil dengan baik bagi saya.2kk∈{−2,...,2}
Tentu saja, kami @ciri berkata, menormalkan data dll selalu merupakan ide yang baik.