Jika Anda bisa menerapkan SVM, Anda bisa mengukur fitur-fiturnya. :)
Biasanya fitur dikuantisasi menggunakan k-means clustering. Pertama, Anda memutuskan apa "ukuran kosakata" Anda seharusnya (katakan 200 "kata-kata visual"), dan kemudian Anda menjalankan k-means clustering untuk jumlah cluster (200). Deskriptor SIFT adalah vektor dari 128 elemen, yaitu titik dalam ruang 128 dimensi. Jadi, Anda dapat mencoba mengelompokkannya, seperti poin lainnya. Anda mengekstrak deskriptor SIFT dari sejumlah besar gambar, mirip dengan yang ingin Anda klasifikasikan menggunakan berbagai fitur. (Idealnya ini harus menjadi set gambar yang terpisah, tetapi dalam praktiknya orang sering hanya mendapatkan fitur dari set gambar pelatihan mereka.) Kemudian Anda menjalankan k-means clustering pada set besar deskriptor SIFT ini untuk mempartisi menjadi 200 (atau apa pun) cluster , yaitu untuk menetapkan setiap deskriptor ke sebuah kluster. k-means akan memberi Anda 200 pusat cluster,
Kemudian Anda mengambil masing-masing deskriptor SIFT di gambar Anda, dan memutuskan yang mana dari 200 cluster miliknya, dengan menemukan pusat cluster terdekat dengan itu. Kemudian Anda cukup menghitung berapa banyak fitur dari setiap cluster yang Anda miliki. Dengan demikian, untuk gambar apa pun dengan sejumlah fitur SIFT Anda memiliki histogram 200 nampan. Itu adalah vektor fitur Anda yang Anda berikan ke SVM. (Catatan, istilah fitur kelebihan beban).
Seingat saya, ada banyak pekerjaan yang dilakukan mengenai bagaimana histogram ini harus dinormalisasi. Saya mungkin salah, tetapi saya sepertinya mengingat sebuah makalah yang mengklaim bahwa vektor fitur biner (yaitu 1 jika setidaknya 1 fitur dari kluster ini ada, dan 0 sebaliknya) bekerja lebih baik daripada histogram. Anda harus memeriksa literatur untuk detailnya, dan detailnya penting.
Sunting: Toolbox Sistem Visi Komputer untuk MATLAB sekarang menyediakan sekumpulan fungsionalitas fitur .