Pertanyaan yang diberi tag «deterministic-policy»

3
Apakah kebijakan optimal selalu stokastik jika lingkungannya juga stokastik?
Apakah kebijakan optimal selalu stokastik (yaitu, peta dari negara ke distribusi probabilitas atas tindakan) jika lingkungan juga stokastik? Secara intuitif, jika lingkungan bersifat deterministik (yaitu, jika agen dalam keadaan sss dan mengambil tindakan aaa , maka keadaan selanjutnya s′s′s' selalu sama, tidak peduli langkah waktu mana), maka kebijakan yang optimal …
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.