Klasifikasi gambar adalah tugas menugaskan salah satu darilabel yang sebelumnya dikenal untuk gambar yang diberikan. Misalnya, Anda tahu bahwa Anda akan diberikan beberapa foto dan masing-masing gambar memiliki satu fotodi dalamnya. Algoritme harus mengatakan apa yang ditunjukkan foto.
Kumpulan data patokan untuk klasifikasi gambar adalah ImageNet ; terutama tantangan pengenalan visual skala besar (LSVRC) Anda . Ini memiliki tepat 1000 kelas dan sejumlah besar data pelatihan (saya pikir ada versi down-sampel dengan sekitar 250px x 250px gambar, tetapi banyak gambar tampaknya berasal dari Flicker).
Tantangan ini biasanya diselesaikan dengan CNN (atau jaringan saraf lainnya).
Apakah ada kertas yang mencoba pendekatan yang tidak menggunakan jaringan saraf di LSVRC?
Untuk memperjelas pertanyaan: Tentu saja, ada algoritma klasifikasi lain seperti tetangga terdekat atau SVM. Namun, saya ragu mereka bekerja sama sekali untuk banyak kelas / data sebanyak itu. Setidaknya untuk-NN Saya yakin prediksi akan sangat lambat; untuk SVM saya kira pas dan prediksi akan banyak memperlambat (?).