Saat ini saya sedang mengerjakan CBIR menggunakan Component Tree , yang seharusnya merupakan ide yang relatif baru. Beberapa keuntungan yang diharapkan dari menggunakan Pohon Komponen untuk menggambarkan gambar adalah:
- Representasi Pohon Komponen dari suatu gambar tidak akan terlalu tergantung pada deformasi (bahkan proyektif) ke gambar
- Memeriksa berbagai tingkat pohon akan memungkinkan perbandingan dan operasi hingga tingkat detail yang berbeda
- Diskriminasi dan deskripsi harus bekerja lebih baik daripada teknik saat ini pada gambar bertekstur rendah.
Ketika saya baru saja memulai dengan penelitian yang berkaitan dengan topik ini, saya hanya memiliki gagasan yang samar tentang tujuan saya: mewakili gambar dengan Pohon Komponen dan kemudian membandingkan Pohon Komponen tersebut, baik secara langsung dengan menemukan representasi vektor. Saya mungkin dapat mengatakan lebih banyak dalam beberapa minggu (atau bulan), tetapi untuk sekarang saya hanya dapat menawarkan daftar makalah yang direkomendasikan kepada saya sebagai pengantar Pohon Komponen (saya belum membacanya):
Saya mungkin dapat memperbarui jawabannya sebagai dan jika saya menemukan sesuatu yang relevan.
Juga, jika tujuan Anda adalah, dengan cara tertentu, lebih tepat mencocokkan wilayah gambar daripada hanya titik , karena daerah mungkin lebih diskriminatif, ada saran bagus di J. Sivic dan A. Zisserman: "Video Google: Pengambilan Teks Pendekatan ke Pencocokan Objek dalam Video " .
Saya merujuk ke bagian yang berhubungan dengan Konsistensi Spasial , di mana sekelompok kecocokan antara titik fitur diterima hanya jika titik fitur mempertahankan konfigurasi spasial yang sama di kedua gambar. Dengan demikian, pencocokan tidak hanya tergantung pada jenis fitur yang diekstraksi (DoG, MSER, ...) atau deskriptor (SIFT), tetapi juga terlihat pada lingkungan yang lebih luas dari titik fitur, membuatnya (setidaknya sedikit) tergantung wilayah.