Deskriptor fitur invarian dan Skala dan Rotasi


16

Dapatkah Anda membuat daftar beberapa deskriptor skala dan fitur invarian rotasi untuk digunakan dalam deteksi fitur.

Aplikasi ini untuk mendeteksi mobil dan manusia dalam video yang ditangkap oleh UAV, menggunakan multi-classifier.

Sejauh ini saya telah melihat SIFT dan MSER (yang merupakan affine invarian). Saya juga telah melihat LESH, LESH didasarkan pada model energi lokal, tetapi dihitung dengan cara yang tidak invarian rotasi, saya telah mencoba memikirkan cara untuk memanfaatkan energi lokal, untuk membangun invarian rotasi deskriptor fitur, saya baca di sini Apa saja alternatif gratis untuk SIFT / SURF yang dapat digunakan dalam aplikasi komersial? , bahwa "jika Anda menetapkan orientasi ke titik bunga dan memutar tambalan gambar sesuai, Anda mendapatkan invarian rotasi gratis", tetapi tidak tahu apakah ini bahkan pereda atau bagaimana saya bisa menerapkan ini pada masalah saya, bantuan apa pun akan dihargai, terima kasih


Gunakan ORB (Berorientasi CEPAT dan Rotasi SINGKAT) dari perpustakaan OpenCV.
Harsh Wardhan

Jawaban:


9

Sejauh alternatif untuk SIFT / SURF pergi, pertanyaan yang Anda tautkan memberikan jawaban yang sangat baik.

Ada dua pertanyaan lagi yang bisa saya baca:

  • "bagaimana saya bisa membangun deskriptor fitur yang berguna (mis. invarian rotasi)"?
  • "mengenai pernyataan dari pertanyaan terkait, bagaimana dia menyelesaikan invarian rotasi gratis?"

Membangun deskriptor fitur

Ini adalah topik penelitian yang valid. Penjelas fitur yang baik bukanlah sesuatu yang dapat dibangun oleh siapa saja di siang hari. Orang-orang menerbitkan artikel ketika mereka berhasil memodelkan deskriptor fitur dengan properti yang diinginkan. Ini adalah alasan yang saat ini hanya menggunakan sedikit deskriptor canggih, dan itulah yang saya sarankan untuk Anda lakukan: temukan deskriptor fitur yang bagus untuk kebutuhan Anda .

Mencapai invarian rotasi "gratis"

Anda dapat menentukan gradien dominan , atau orientasi pada tambalan gambar (area fitur Anda). Kemudian, putar tambalan gambar sehingga gradien selalu melihat ke arah yang sama, misalnya (ke atas). Misalnya jika Anda memiliki a dan gambar, gradien dominannya masing-masing akan menunjuk ke kiri ( ) dan kanan ( ), dan ketika Anda memutarnya dengan jumlah ini, Anda mendapatkan gambar yang sama.0|black->gray->white||white->gray->black|-9090

Dengan cara ini Anda akan selalu menghitung deskriptor pada tambalan gambar dengan orientasi dominan yang sama (tambalan diputar), dan dengan demikian Anda mencapai invarian rotasi.


4

Cara lain untuk mendapatkan invarian rotasi gratis, adalah memilih objek yang invarian rotasi. Misalnya, lingkaran atau cincin tidak sama dengan rotasi.

Extractor fitur : Jalankan deteksi tepi. Untuk setiap lingkungan NxNpiksel, hitung arah tepi dan besarnya 2D histogram. Temukan semua titik yang memiliki total magnitudo tinggi , dan penyebaran sudut yang tinggi . Hapus semua titik yang tidak memiliki simetri radial.

Deskriptor fitur : Temukan pusat setiap objek lingkaran. Karena objeknya melingkar, ia tidak memiliki sudut gradien yang dominan. Semua sudut sama. Dengan demikian, profil radial (jumlah nilai piksel dalam koordinat kutub) adalah deskriptor sudut invarian.


Omong-omong, itulah salah satu alasan mengapa fidusia diproduksi sebagai lingkaran pada papan sirkuit listrik:

masukkan deskripsi gambar di sini


kita berbicara tentang deskriptor keypoint (fitur) . Jika kita berbicara tentang fitur (poin minat) , maka mendeteksi tambalan melingkar mungkin berguna - mereka berubah secara invarian dalam kombinasi dengan setiap deskriptor. Tetapi deskriptor yang dihitung pada patch lingkaran tidak - sebuah lingkaran putih dengan diameter horizontal berwarna hitam, dan dengan yang vertikal akan menghasilkan deskriptor yang sangat berbeda jika metode invarian rotasi tidak digunakan
penelope

@penelope, mengapa tidak? Pertimbangkan deskriptor berikut - thumbnail tambalan, dan Anda membandingkannya dengan deskriptor lain dengan korelasi silang dinormalisasi. Anda tidak dapat keliru dengan benda lain dengan cara ini.
Andrey Rubshtein

Maaf, saya tidak mengerti apa yang Anda maksud dengan "thumbnail patch" yang bisa Anda jelaskan? Dan deskriptor: kors-normalisasi-korelasi patch Anda adalah apa yang membuatnya berubah secara invarian, bukan fakta bahwa patch Anda adalah cincin atau lingkaran.
penelope

@ Penelope, saya kira sekarang saya tidak cukup jelas. Saya akan mencoba mengembangkannya besok. Terima kasih atas komentar anda
Andrey Rubshtein

Menantikan hal itu :)
penelope

1

Saya lebih suka melihat ke KAZE / AKAZE, yang berkinerja sama baiknya dengan kecepatan yang signifikan. Kasus deformasi juga dapat ditoleransi. OpenCV baru-baru ini mendapatkan implementasi melalui GSoC 2014. Anda dapat menemukannya di sini .


1

Jika Anda memetakan kembali tambalan lokal di sekitar titik fitur ke log-polar koordinat (dengan asal di tempat tujuan), perubahan skala berhubungan dengan terjemahan sepanjang sumbu log-radial, sementara rotasi sesuai dengan terjemahan (dengan wrap-around) sepanjang sumbu sudut. Jika Anda kemudian menghitung transformasi Fourier dua dimensi, terjemahan dalam arah radial dan sudut menjadi pergeseran fase dalam domain frekuensi. Jika Anda kemudian menghitung nilai absolut dari transformasi Fourier, fase menghilang sepenuhnya, dan perubahan skala dan rotasi patch gambar asli menjadi tidak terlalu mencolok. Jadi nilai absolut dari transformasi 2D Fourier dari gambar dalam koordinat log-poolar akan menjadi deskriptor fitur Anda.

Setidaknya dalam teori. Dalam praktiknya, Anda perlu membatasi ekstensi radial tambalan Anda. Ini berarti bahwa Anda perlu memotong sebagian besar data Anda sebelum menghitung transformasi Fourier (yang benar-benar seri Fourier), jadi terjemahan sepanjang arah log-radial dalam koordinat log-polar tidak persis sesuai dengan hanya pergeseran fase dalam domain frekuensi lagi, sehingga metode ini tidak sempurna skala-invarian. Saya menduga bahwa jika Anda menggunakan beberapa fungsi jendela - tanpa diskontinuitas - pada koordinat log-radius dan mengalikannya dengan intensitas warna, masalah ini akan agak dikurangi.

Namun, deskriptor fitur itu harus tetap invarian rotasi sempurna.

Referensi: Skala Invariance tanpa Seleksi Skala


0

Anda juga dapat memeriksa FAST dan BRISK .


Sejauh yang saya cari, FAST hanya detektor yang digunakan dengan banyak kombinasi deskriptor yang berbeda. Dan, FAST dan BRISK telah disebutkan dalam pertanyaan yang telah dikaitkan OP sendiri, jadi saya kira dia sudah memiliki informasi tentang keberadaan metode ini.
penelope
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.