Unit GRU LENGKAP
c~t=tanh(Wc[Gr∗ct−1,xt]+bc)
Gu=σ(Wu[ct−1,xt]+bu)
Gr=σ(Wr[ct−1,xt]+br)
ct=Gu∗c~t+(1−Gu)∗ct−1
at=ct
Unit LSTM
c~t=tanh(Wc[at−1,xt]+bc)
Gu=σ(Wu[at−1,xt]+bu)
Gf=σ(Wf[at−1,xt]+bf)
Go=σ(Wo[at−1,xt]+bo)
ct=Gu∗c~t+Gf∗ct−1
at=Go∗tanh(ct)
Seperti dapat dilihat dari persamaan LSTM memiliki gerbang pembaruan yang terpisah dan gerbang lupa. Ini jelas membuat LSTM lebih canggih tetapi pada saat yang sama lebih kompleks juga. Tidak ada cara sederhana untuk memutuskan mana yang akan digunakan untuk kasus penggunaan khusus Anda. Anda selalu harus melakukan coba-coba untuk menguji kinerja. Namun, karena GRU lebih sederhana daripada LSTM, GRU akan membutuhkan waktu lebih sedikit untuk melatih dan lebih efisien.
Penghargaan: Andrew Ng