Pertanyaan yang diberi tag «gradient-descent»

2
Apakah mean-squared error selalu cembung dalam konteks jaringan saraf?
Berbagai sumber yang saya sebutkan menyebutkan bahwa MSE itu hebat karena cembung. Tapi saya tidak mengerti caranya, terutama dalam konteks jaringan saraf. Katakanlah kita memiliki yang berikut ini: XXX : dataset pelatihan YYY : target ΘΘ\Theta : himpunan parameter modelfΘfΘf_\Theta (model jaringan saraf dengan non-linearitas) Kemudian: MSE(Θ)=(fΘ(X)−Y)2MSE⁡(Θ)=(fΘ(X)−Y)2\operatorname{MSE}(\Theta) = (f_\Theta(X) - …
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.