Saya memiliki 12 perangkat pelatihan positif (sel kanker yang diobati dengan obat dengan masing-masing dari 12 mekanisme aksi yang berbeda). Untuk setiap rangkaian pelatihan positif ini, saya ingin melatih mesin vektor-dukungan untuk membedakannya dari set negatif dengan ukuran yang sama yang disampling dari percobaan. Setiap set memiliki antara 1000 dan 6000 sel, dan ada 476 fitur (fitur gambar) dari masing-masing sel, masing-masing diskalakan secara linear hingga [0, 1].
Saya menggunakan LIBSVM dan kernel Gaussian RGB. Menggunakan validasi silang lima kali lipat, saya telah melakukan pencarian grid untuk log₂ C ∈ [-5, 15] dan log₂ ɣ ∈ [-15, 3]. Hasilnya adalah sebagai berikut:
Saya kecewa karena tidak ada satu set parameter yang memberikan akurasi tinggi untuk semua 12 masalah klasifikasi. Saya juga terkejut bahwa grid umumnya tidak menunjukkan wilayah dengan akurasi tinggi dikelilingi oleh akurasi yang lebih rendah. Apakah ini hanya berarti bahwa saya perlu memperluas ruang parameter pencarian, atau apakah pencarian kotak indikasi bahwa ada sesuatu yang salah?