Arti formula itu sangat sederhana. Bayangkan Anda mengambil dua area kecil berukuran sama dari sebuah gambar, yang biru dan merah:
Fungsi jendela sama dengan 0 di luar persegi panjang merah (untuk kesederhanaan, kita dapat menganggap jendela hanya konstan di dalam persegi panjang merah). Jadi fungsi jendela memilih piksel mana yang ingin Anda lihat dan memberikan bobot relatif untuk setiap piksel. (Paling umum adalah jendela Gaussian, karena itu rotasi simetris, efisien untuk menghitung dan menekankan piksel di dekat pusat jendela.) Kotak biru bergeser oleh (u, v).
Selanjutnya Anda menghitung jumlah selisih kuadrat antara bagian gambar yang ditandai merah dan biru, yaitu Anda mengurangkannya piksel demi piksel, kuadratkan perbedaannya dan jumlah hasilnya (dengan asumsi, untuk kesederhanaan bahwa jendela = 1 di area yang kita cari di). Ini memberi Anda satu nomor untuk setiap kemungkinan (u, v) -> E (u, v).
Mari kita lihat apa yang terjadi jika kita menghitungnya untuk nilai u / v yang berbeda:
Pertahankan pertama v = 0:
Ini seharusnya tidak mengejutkan: Perbedaan antara bagian-bagian gambar paling rendah ketika offset (u, v) di antara mereka adalah 0. Ketika Anda meningkatkan jarak antara dua tambalan, jumlah perbedaan kuadrat juga meningkat.
Menjaga Anda = 0:
Plot terlihat mirip, tetapi jumlah perbedaan kuadrat antara dua bagian gambar jauh lebih kecil ketika Anda menggeser persegi panjang biru ke arah tepi.
Alur lengkap E (u, v) terlihat seperti ini:
Plotnya terlihat seperti "ngarai": Hanya ada sedikit perbedaan jika Anda menggeser gambar ke arah ngarai. Itu karena tambalan gambar ini memiliki orientasi dominan (vertikal).
Kita dapat melakukan hal yang sama untuk patch gambar yang berbeda:
Di sini, plot E (u, v) terlihat berbeda:
Tidak peduli ke arah mana Anda menggeser tambalan, selalu terlihat berbeda.
Jadi bentuk fungsi E (u, v) memberi tahu kita sesuatu tentang tambalan gambar
- jika E (u, v) mendekati 0 di mana-mana, tidak ada tekstur pada tambalan gambar yang Anda lihat
- jika E (u, v) berbentuk "ngarai", tambalan memiliki orientasi dominan (ini bisa berupa tepi atau tekstur)
- jika E (u, v) berbentuk "kerucut", tambalan memiliki tekstur, tetapi tidak memiliki orientasi dominan. Itulah jenis patch yang dicari oleh detektor sudut.
Banyak referensi mengatakan itu adalah besarnya dimana jendela 'w' bergeser ... jadi berapa banyak jendela yang digeser? Satu piksel ... dua piksel?
Biasanya, Anda tidak menghitung E (u, v) sama sekali. Anda hanya tertarik pada bentuknya di lingkungan (u, v) = (0,0). Jadi Anda hanya ingin ekspansi Taylor dari E (u, v) dekat (0,0), yang sepenuhnya menggambarkan "bentuk" itu.
Apakah penjumlahan atas posisi piksel tertutup oleh jendela?
Secara matematis, akan lebih elegan untuk membiarkan rentang penjumlahan ke semua piksel. Secara praktis, tidak ada gunanya menjumlahkan piksel di mana jendelanya 0.