Saya mendengar Andrew Ng (dalam video yang sayangnya tidak dapat saya temukan lagi) berbicara tentang bagaimana pemahaman tentang minimum lokal dalam masalah pembelajaran yang mendalam telah berubah dalam arti bahwa mereka sekarang dianggap kurang bermasalah karena dalam ruang dimensi tinggi (ditemui dalam pembelajaran mendalam) poin-poin kritis lebih cenderung menjadi poin pelana atau dataran tinggi daripada minimum lokal.
Saya telah melihat makalah (misalnya yang ini ) yang membahas asumsi di mana "setiap minimum lokal adalah minimum global". Asumsi-asumsi ini semuanya agak teknis, tetapi dari apa yang saya mengerti mereka cenderung memaksakan struktur pada jaringan saraf yang membuatnya agak linier.
Apakah ini klaim yang valid bahwa, dalam pembelajaran mendalam (termasuk arsitektur nonlinier), dataran tinggi lebih mungkin daripada minimum lokal? Dan jika demikian, apakah ada intuisi (mungkin matematika) di baliknya?
Apakah ada hal khusus tentang pembelajaran mendalam dan poin pelana?