Ada beberapa variasi tentang cara menormalkan gambar tetapi sebagian besar tampaknya menggunakan dua metode ini:
- Kurangi rata-rata per saluran yang dihitung atas semua gambar (mis. VGG_ILSVRC_16_layers )
- Kurangi dengan piksel / saluran yang dihitung atas semua gambar (mis. CNN_S , lihat juga jaringan referensi Caffe )
Pendekatan alami akan dalam pikiran saya untuk menormalkan setiap gambar. Sebuah gambar yang diambil di siang hari bolong akan menyebabkan lebih banyak neuron terbakar daripada gambar malam hari dan sementara itu dapat memberi tahu kita tentang waktu kita biasanya peduli tentang fitur yang lebih menarik hadir di tepi dll.
Pierre Sermanet merujuk pada 3.3.3 bahwa normalisasi kontras lokal yang akan berdasarkan per-gambar tapi saya belum menemukan ini dalam salah satu contoh / tutorial yang saya lihat. Saya juga telah melihat pertanyaan Quora yang menarik dan posting Xiu-Shen Wei tetapi mereka tampaknya tidak mendukung dua pendekatan di atas.
Apa sebenarnya yang saya lewatkan? Apakah ini masalah normalisasi warna atau ada makalah yang benar-benar menjelaskan mengapa begitu banyak yang menggunakan pendekatan ini?