Jika ini hanya kasus satu kali, Anda bisa melatih kembali jaringan saraf. Jika Anda sering harus menambahkan kelas baru, maka ini adalah ide yang buruk. Apa yang ingin Anda lakukan dalam kasus seperti itu disebut pengambilan gambar berbasis konten (CBIR), atau hanya pencarian gambar atau pencarian visual. Saya akan menjelaskan kedua kasus dalam jawaban saya di bawah ini.
Kasing satu kali
Jika ini hanya terjadi sekali - Anda lupa kelas 11, atau pelanggan Anda berubah pikiran - tetapi itu tidak akan terjadi lagi , maka Anda dapat dengan mudah simpul output ke 11 ke lapisan terakhir. Inisialisasi bobot ke node ini secara acak, tetapi gunakan bobot yang sudah Anda miliki untuk output lainnya. Lalu, latih saja seperti biasa. Mungkin bermanfaat untuk memperbaiki beberapa bobot, yaitu jangan melatih ini.
Kasus ekstrem adalah hanya melatih bobot baru, dan membiarkan semua yang lain tetap. Tetapi saya tidak yakin apakah ini akan bekerja dengan baik - mungkin patut dicoba.
Pengambilan gambar berbasis konten
Pertimbangkan contoh berikut: Anda bekerja untuk toko CD, yang ingin pelanggan mereka dapat mengambil gambar sampul album, dan aplikasi menunjukkan kepada mereka CD yang mereka pindai di toko online mereka. Dalam hal ini, Anda harus melatih kembali jaringan untuk setiap CD baru yang mereka miliki di toko. Itu mungkin 5 CD baru setiap hari, jadi latih ulang jaringan dengan cara itu tidak cocok.
Solusinya adalah melatih jaringan, yang memetakan gambar ke dalam ruang fitur. Setiap gambar akan diwakili oleh deskriptor, yaitu vektor 256 dimensi. Anda dapat "mengklasifikasikan" gambar dengan menghitung deskriptor ini, dan membandingkannya dengan database deskriptor Anda (yaitu deskriptor semua CD yang Anda miliki di toko Anda). Deskriptor terdekat dalam basis data menang.
Bagaimana Anda melatih jaringan saraf untuk mempelajari vektor deskripsi seperti itu? Itu adalah bidang penelitian aktif. Anda dapat menemukan karya terbaru dengan mencari kata kunci seperti "pengambilan gambar" atau "pembelajaran metrik".
Saat ini, orang biasanya mengambil jaringan pra-terlatih, misalnya VGG-16, memotong lapisan FC, dan menggunakan konvolusional akhir sebagai vektor deskriptor Anda. Anda dapat lebih lanjut melatih jaringan ini misalnya dengan menggunakan jaringan siam dengan kehilangan triplet.