Saat ini saya sedang bereksperimen dengan gridsearch untuk melatih mesin vektor dukungan. Saya mengerti bahwa, jika saya memiliki parameter gamma dan C, fungsi R tune.svm melakukan validasi silang 10 kali lipat untuk semua kombinasi dari 2 parameter ini.
Karena saya tidak tahu bagaimana memulainya, saya mencoba untuk mendapatkan beberapa informasi tentangnya, misalnya wikipedia 2 menyarankan nilai-nilai yang tidak linear, misalnya C dalam kisaran {10, 100, 1000}.
Sejauh ini saya menggunakan contoh-contoh dari tautan wikipedia kedua saya, yaitu:
gammas = 2^(-15:3)
costs = 2^(-5:15)
Yang menghasilkan 399 kombinasi.
Ini sangat, sangat lama (~ 2000 sampel). Sebagai contoh untuk kernel "radial" hasil terbaik saya adalah gamma = 0,5 dan biaya = 2.
Tidak bisakah saya mendapatkan hasil yang sama jika saya hanya menggunakan nilai seperti (1, 2, 3, 4, ... 10) untuk biaya dan (0, 0,5, 1, 1,5, 2) untuk gammas? Saya tahu contoh ini dibangun karena saya sudah tahu hasilnya.
Pertanyaan saya:
Tapi mengapa skala eksponensial ini?
Ada begitu banyak nilai antara 0 dan 1 yang saya pikir ini buang-buang waktu perhitungan dan hanya beberapa angka yang sangat besar yang tidak dapat menemukan hasil yang sangat tepat pula. Itu hanya masuk akal bagi saya jika ini digunakan untuk menemukan rentang yang lebih kecil, katakanlah kita kemudian tahu biaya terbaik adalah 2 ^ 3 dan kemudian kita mencari di sekitar itu. Tapi itu tidak disebutkan di mana dilakukan seperti itu.