Saya telah membaca bahwa sebagian besar masalah dapat diselesaikan dengan 1-2 lapisan tersembunyi. Bagaimana Anda tahu Anda membutuhkan lebih dari 2? Untuk masalah apa Anda membutuhkannya (beri saya contoh)?
Dua fungsi aktivasi yang umum digunakan dalam pembelajaran dalam adalah fungsi tangen hiperbolik dan fungsi aktivasi sigmoid. Saya mengerti bahwa garis singgung hiperbolik hanyalah pengubahan dan terjemahan fungsi sigmoid: tanh( z) = 2 σ( z) - 1tanh(z)=2σ(z)-1\tanh(z) = 2\sigma(z) - 1. Apakah ada perbedaan yang signifikan antara kedua fungsi aktivasi …