Jadi, saya membaca makalah tentang SURF (Bay, Ess, Tuytelaars, Van Gool: Fitur Kuat yang Dipercepat (SURF) ) dan saya tidak dapat memahami paragraf ini di bawah ini:
Karena penggunaan filter kotak dan gambar integral, kami tidak perlu menerapkan filter yang sama secara berulang pada output dari lapisan yang sebelumnya difilter, tetapi sebaliknya dapat menerapkan filter kotak dengan ukuran apa pun dengan kecepatan yang persis sama langsung pada gambar asli dan bahkan secara paralel (meskipun yang terakhir tidak dieksploitasi di sini). Oleh karena itu, ruang skala dianalisis dengan meningkatkan skala ukuran filter daripada secara iteratif mengurangi ukuran gambar, gambar 4.
This is figure 4 in question.
PS: Makalah ini memiliki penjelasan tentang gambar integral, namun seluruh isi makalah ini didasarkan pada paragraf tertentu di atas. Jika ada yang membaca makalah ini, bisakah Anda menyebutkan secara singkat apa yang sedang terjadi di sini. Penjelasan matematika keseluruhan cukup rumit untuk memiliki pemahaman yang baik pertama, jadi saya butuh bantuan. Terima kasih.
Edit, beberapa masalah:
1.
Setiap oktaf dibagi lagi menjadi jumlah skala skala yang konstan. Karena sifat diskrit dari gambar integral, perbedaan skala minimum antara 2 skala berikutnya tergantung pada panjang lob positif atau negatif dari turunan urutan kedua parsial dalam arah derivasi (x atau y), yang diatur ke sepertiga dari panjang ukuran filter. Untuk filter 9x9, panjang lo ini adalah 3. Untuk dua level berturut-turut, kita harus meningkatkan ukuran ini dengan minimum 2 piksel (satu piksel di setiap sisi) untuk menjaga ukurannya tidak rata dan dengan demikian memastikan keberadaan piksel pusat . Ini menghasilkan peningkatan total ukuran topeng sebesar 6 piksel (lihat gambar 5).
Figure 5
Saya tidak bisa memahami garis-garis dalam konteks yang diberikan.
Untuk dua tingkat berturut-turut, kita harus meningkatkan ukuran ini dengan minimum 2 piksel (satu piksel di setiap sisi) untuk menjaga ukurannya tidak rata dan dengan demikian memastikan keberadaan piksel pusat.
Saya tahu mereka mencoba melakukan sesuatu dengan panjang gambar, jika bahkan mereka mencoba membuatnya aneh, sehingga ada piksel pusat yang akan memungkinkan mereka untuk menghitung maksimum atau minimum dari gradien piksel. Saya agak ragu tentang makna kontekstualnya.
2.
Untuk menghitung deskriptor wavelet Haar digunakan.
3.
Apa perlunya memiliki filter perkiraan?
4. Saya tidak memiliki masalah dengan cara mereka mengetahui ukuran filter. Mereka "melakukan" sesuatu secara empiris. Namun, saya memiliki masalah yang mengganggu dengan bagian ini
Output dari filter 9x9, diperkenalkan pada bagian sebelumnya, dianggap sebagai lapisan skala awal, yang akan kita sebut skala s = 1.2 (mendekati turunan Gaussian dengan σ = 1.2).
Bagaimana mereka mengetahui tentang nilai σ. Apalagi bagaimana perhitungan penskalaan yang dilakukan ditunjukkan pada gambar di bawah ini. Alasan saya menyatakan tentang gambar ini adalah bahwa nilai s=1.2
terus berulang, tanpa dengan jelas menyatakan tentang asal-usulnya.
5.
Matriks Hessian diwakili dalam hal L
yang merupakan konvolusi gradien urutan kedua dari filter Gausssian dan gambar.
Namun determinan "diperkirakan" dikatakan hanya berisi istilah yang melibatkan filter Gaussian orde kedua.
Nilai w
adalah:
Pertanyaan saya mengapa determinan dihitung seperti itu di atas, dan apa hubungan antara matriks Hessian dan Hessian perkiraan.