Apa sebenarnya blok Pembelajaran Residual dalam konteks Deep Residual Networks in Deep Learning?


12

Saya membaca makalah Deep Residual Learning untuk Pengenalan Gambar dan saya mengalami kesulitan memahami dengan kepastian 100% apa yang diperlukan oleh blok residual secara komputasi. Membaca makalah mereka, mereka memiliki angka 2:

masukkan deskripsi gambar di sini

yang menggambarkan apa yang seharusnya menjadi Blok Residual. Apakah perhitungan blok residu sama dengan:

y=σ(W2σ(W1x+b1)+b2+x)

Atau itu sesuatu yang lain?

Dengan kata lain mungkin untuk mencoba mencocokkan notasi kertas, adalah:

F(x)+x=[W2σ(W1x+b1)+b2]+x

Benarkah itu?

y

σ(F(x)+x)=σ([W2σ(W1x+b1)+b2]+x)

σ


is x is positive relu (x) = x
Ray Tayek

Jawaban:


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.