Saat menggunakan libsvm
, parameter adalah parameter untuk fungsi kernel. Nilai standarnya adalah setup sebagaiγ = 1
Apakah ada panduan teoretis untuk mengatur parameter ini selain metode yang ada, misalnya, pencarian kisi?
Saat menggunakan libsvm
, parameter adalah parameter untuk fungsi kernel. Nilai standarnya adalah setup sebagaiγ = 1
Apakah ada panduan teoretis untuk mengatur parameter ini selain metode yang ada, misalnya, pencarian kisi?
Jawaban:
Saya akan menyarankan panduan teoretis berikut. Saat Anda menggunakan kernel Gaussian RBF, permukaan pemisah Anda akan didasarkan pada kombinasi permukaan berbentuk lonceng yang berpusat di masing-masing vektor dukungan. Lebar setiap permukaan berbentuk lonceng akan berbanding terbalik dengan . Jika lebar ini lebih kecil dari jarak minimum pasangan untuk data Anda, Anda pada dasarnya memiliki overfitting. Jika lebar ini lebih besar dari jarak maksimum pasangan untuk data Anda, semua poin Anda jatuh ke dalam satu kelas dan Anda tidak memiliki kinerja yang baik juga. Jadi lebar optimal harus berada di antara dua ekstrem ini.
Tidak, ini pada dasarnya bergantung pada data. Pencarian grid (lebih dari parameter log yang diubah log) adalah metode yang sangat baik jika Anda hanya memiliki sedikit parameter hiper untuk disetel, tetapi jangan membuat resolusi grid terlalu halus atau Anda cenderung terlalu menyesuaikan tala. kriteria. Untuk masalah dengan sejumlah besar parameter kernel, saya menemukan metode simpel Nelder-Mead bekerja dengan baik.
pair-wise distance for your data
= jarak Euclidean sederhana setelah penskalaan?