Saya pikir ada beberapa hal yang membingungkan Anda, jadi hal pertama yang pertama.
Diberi sinyal x [ n ], dan kernel (juga disebut filter) h [ n ], kemudian belokan dari x [ n ] dengan h [n ] ditulis sebagai y[ n ] = ( x ⋆ h ) [ n ], dan dihitung melalui produk titik geser, secara matematis diberikan oleh:
y[ n ] = Âm = - ∞∞x [ m ] h [ n - m ]
Di atas jika untuk sinyal satu dimensi, tetapi yang sama dapat dikatakan untuk gambar, yang hanya sinyal dua dimensi. Dalam hal ini, persamaannya menjadi:
sayan e w[ r , c ] = ¢u = - ∞∞∑v = - ∞∞sayao l d[ u , v ] k [ r - u , c - v ]
Secara imajiner, inilah yang terjadi:
Bagaimanapun, hal yang perlu diingat, adalah bahwa kernel , sebenarnya dipelajari selama pelatihan Deep Neural Network (DNN). Kernel hanya akan menjadi apa yang Anda gabungkan input Anda dengan. DNN akan mempelajari kernel, sehingga menampilkan aspek-aspek tertentu dari gambar (atau gambar sebelumnya), yang akan baik untuk menurunkan kehilangan tujuan target Anda.
Ini adalah poin penting pertama yang harus dipahami: Secara tradisional orang telah mendesain kernel, tetapi dalam Deep Learning, kami membiarkan jaringan memutuskan kernel apa yang terbaik. Namun satu hal yang kami tentukan adalah dimensi kernel. (Ini disebut hyperparameter, misalnya, 5x5, atau 3x3, dll).