Pertanyaan yang diberi tag «value-iteration»

4
Apa perbedaan antara iterasi nilai dan iterasi kebijakan?
Dalam pembelajaran penguatan, apa perbedaan antara iterasi kebijakan dan iterasi nilai ? Sejauh yang saya pahami, dalam iterasi nilai, Anda menggunakan persamaan Bellman untuk menyelesaikan kebijakan yang optimal, sedangkan, dalam iterasi kebijakan, Anda secara acak memilih kebijakan π, dan menemukan imbalan dari kebijakan itu. Keraguan saya adalah jika Anda memilih …
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.