Ilmu Komputer reinforcement-learning

Arti faktor diskon pada pembelajaran penguatan

Setelah membaca pencapaian google deepmind di game Atari , saya mencoba memahami q-learning dan q-networks, tapi saya agak bingung. Kebingungan muncul dalam konsep faktor diskon. Ringkasan singkat tentang apa yang saya mengerti. Jaringan saraf convolutional yang mendalam digunakan untuk memperkirakan nilai dari nilai yang diharapkan optimal dari suatu tindakan. Jaringan …

10 artificial-intelligence neural-networks reinforcement-learning

Pertanyaan yang diberi tag «reinforcement-learning»