Ini adalah pertanyaan konseptual kecil yang telah mengganggu saya untuk sementara waktu: Bagaimana kita dapat kembali-menyebar melalui lapisan max-pooling dalam jaringan saraf?
Saya menemukan max-pooling layers saat membaca tutorial ini untuk library nn Torch 7. Pustaka mengabstraksi perhitungan gradien dan meneruskan untuk setiap lapisan jaringan yang dalam. Saya tidak mengerti bagaimana perhitungan gradien dilakukan untuk lapisan max-pooling.
Saya tahu bahwa jika Anda memiliki input masuk ke neuron dari layer , maka (didefinisikan sebagai ) diberikan oleh:
Jadi, lapisan kumpulan-max akan menerima dari lapisan berikutnya seperti biasa; tetapi karena fungsi aktivasi untuk max-pooling neuron mengambil vektor nilai (lebih dari yang dimaksimalkan) sebagai input, bukan angka tunggal lagi, tetapi vektor ( harus diganti oleh ). Lebih lanjut, , sebagai fungsi maksimal, tidak dapat dibedakan sehubungan dengan inputnya.
Jadi .... bagaimana cara kerjanya tepatnya?