Dimensi keluaran konvolusi dalam pembelajaran mendalam tergantung pada banyak faktor
- ukuran filter (alias kernel)
- padding (apakah Anda menambahkan nol atau tidak di sekitar gambar Anda dan berapa banyak)
- jumlah filter yang Anda gunakan
- langkahnya
Ketergantungan yang paling sederhana adalah pada jumlah filter N
. Ini memberi Anda jumlah peta fitur yang memiliki output Anda. Untuk input yang mungkin berupa saluran RGB yaitu 3, untuk output nomor ini dapat dipilih secara bebas.
Faktor berikutnya adalah zero-padding. Jika Anda menggunakan ukuran filter (3,3) dan padding "valid" yaitu menambahkan NO nol di sekitar gambar Anda berakhir dengan output dimensi.
(100, 100, 3) -> (98, 98, N)
Karena Anda menggunakan langkah 1. Jika Anda memindahkan filter melintasi gambar di akhir gambar di setiap arah, filter akan mengenai batas setelah 98 langkah.
Namun, jika Anda menggunakan lapisan "SAMA" Anda mengimbangi ukuran filter -dalam kasus ukuran filter (3,3) yang akan sesuai dengan satu baris nol di sekitar gambar- Anda akan berakhir dengan:
(100, 100, 3) -> (100, 100, N)
Dengan langkah 2 misalnya Anda menggeser posisi filter dengan dua piksel. Karena itu, Anda dapatkan
(100, 100, 3) -> (50, 50, N)