Dua fungsi aktivasi yang umum digunakan dalam pembelajaran dalam adalah fungsi tangen hiperbolik dan fungsi aktivasi sigmoid. Saya mengerti bahwa garis singgung hiperbolik hanyalah pengubahan dan terjemahan fungsi sigmoid:
.
Apakah ada perbedaan yang signifikan antara kedua fungsi aktivasi ini, dan khususnya, kapan satu lebih disukai dari yang lain ?
Saya menyadari bahwa dalam beberapa kasus (seperti ketika memperkirakan probabilitas) output dalam kisaran lebih nyaman daripada keluaran yang berkisar dari . Saya ingin tahu apakah ada perbedaan selain kenyamanan yang membedakan dua fungsi aktivasi.