Gambar non-persegi untuk klasifikasi gambar


9

Saya memiliki dataset gambar lebar: 1760x128. Saya sudah membaca tutorial dan buku, dan kebanyakan dari mereka menyatakan bahwa input gambar harus persegi dan jika tidak, mereka diubah menjadi persegi untuk dilatih di cnns (pada gambar persegi) yang sudah dilatih. Apakah ada cara untuk melatih cnn untuk gambar non persegi, atau haruskah saya mencari opsi lain sebagai padding?

Jawaban:


4

Ada beberapa cara untuk menyelesaikan masalah tergantung pada classifier. Sliding Windows adalah metode yang paling saya kenal, ini digunakan untuk metode jaringan saraf. Metode ini melibatkan pengambilan sub-gambar kecil dan menggesernya ke atas dan ke bawah dengan beberapa tumpang tindih. Beberapa masalah termasuk menemukan parameter shift optimal dan masalah multi skala.

Deteksi akhir biasanya ditentukan oleh seberapa yakin penggolongnya adalah bahwa masing-masing sub-gambar termasuk dalam kelas itu: misalnya suara terbanyak, kemungkinan total, atau total jarak dari batas keputusan. Saya telah membuat daftar beberapa bahan di bawah ini, yang pertama adalah untuk metode pengklasifikasi HOG tetapi konsepnya sama.

  1. Deteksi Objek Geser Jendela
  2. Deteksi Kategori Objek: Menggeser Windows
  3. Pengenalan Terpadu OverFeat, Pelokalan dan Deteksi menggunakan Jaringan Konvolusional

2

Ini seharusnya tidak menimbulkan masalah sama sekali jika Anda menggunakan CNN. Saya membuat CNN untuk mengenali wajah, dan karena wajah biasanya sekitar 70% selebar mereka, saya menggunakan gambar pelatihan yang 80x100 piksel (sedikit lebih lebar jika kepala berada pada sudut). Filter Anda tetap harus kuadrat.

Semua perubahan itu adalah bahwa sekarang Anda harus melacak lebar dan tinggi untuk peta aktivasi / gabungan Anda, bukan hanya satu nilai yang memberi tahu Anda ukurannya. Sebagai contoh -

Gambar input 80 x 100 Menerapkan filter konvolusi 5 x 5 memberikan peta aktivasi pada 76 x 96 Menerapkan pooling 2 x 2 memberikan peta aktivasi yang dikumpulkan pada 38 x 48

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.