Pertanyaan yang diberi tag «reinforcement-learning»

7
Bagaimana cara melatih jaringan saraf tiruan untuk memainkan Diablo 2 menggunakan input visual?
Saat ini saya mencoba mendapatkan ANN untuk memainkan permainan video dan saya berharap mendapatkan bantuan dari komunitas yang luar biasa di sini. Saya telah memilih Diablo 2. Dengan demikian, permainan game dilakukan secara real-time dan dari sudut pandang isometrik, dengan pemain yang mengontrol satu avatar yang dipusatkan kamera. Untuk membuat …

4
Apa perbedaan antara iterasi nilai dan iterasi kebijakan?
Dalam pembelajaran penguatan, apa perbedaan antara iterasi kebijakan dan iterasi nilai ? Sejauh yang saya pahami, dalam iterasi nilai, Anda menggunakan persamaan Bellman untuk menyelesaikan kebijakan yang optimal, sedangkan, dalam iterasi kebijakan, Anda secara acak memilih kebijakan π, dan menemukan imbalan dari kebijakan itu. Keraguan saya adalah jika Anda memilih …


1
TypeError: len tidak didefinisikan dengan baik untuk Tensor simbolik. (aktivasi_3 / Identitas: 0) Silakan hubungi `x.shape` daripada` len (x) `untuk informasi bentuk
Saya mencoba menerapkan model DQL pada satu permainan gym openAI. Tapi itu memberi saya kesalahan berikut. TypeError: len tidak didefinisikan dengan baik untuk Tensor simbolik. (aktivasi_3 / Identitas: 0) Silakan hubungi x.shapedaripada len(x) untuk informasi bentuk. Menciptakan lingkungan gym: ENV_NAME = 'CartPole-v0' env = gym.make(ENV_NAME) np.random.seed(123) env.seed(123) nb_actions = env.action_space.n …
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.