Kecerdasan buatan reinforcement-learning

1

Apa operator Bellman dalam pembelajaran penguatan?

Dalam matematika, kata operator dapat merujuk ke beberapa konsep yang berbeda tetapi terkait. Operator dapat didefinisikan sebagai fungsi antara dua ruang vektor, dapat didefinisikan sebagai fungsi di mana domain dan codomain adalah sama, atau dapat didefinisikan sebagai fungsi dari fungsi (yang merupakan vektor) ke fungsi lain (untuk contoh, operator diferensial …

10 reinforcement-learning terminology math

2

Mengapa baseline bersyarat pada keadaan di beberapa waktu tidak bias?

Dalam robotika, teknik pembelajaran penguatan digunakan untuk menemukan pola kontrol untuk robot. Sayangnya, sebagian besar metode gradien kebijakan secara statistik bias yang dapat membawa robot dalam situasi yang tidak aman, lihat halaman 2 di Jan Peters dan Stefan Schaal: Penguatan pembelajaran keterampilan motorik dengan gradien kebijakan, 2008 Dengan pembelajaran primitif …

9 reinforcement-learning

1

Beberapa keraguan tentang penerapan pembelajaran penguatan untuk permainan seperti catur

Saya menemukan permainan papan catur. Saya membangun mesin sehingga bisa bermain secara otonom. Mesin pada dasarnya adalah pohon keputusan. Ini disusun oleh: Fungsi pencarian yang di setiap node menemukan semua langkah hukum yang mungkin Fungsi evaluasi yang memberikan nilai numerik ke posisi dewan (positif berarti pemain pertama unggul, negatif berarti …

9 reinforcement-learning game-ai game-theory combinatorial-games negamax

3

Apakah pencarian pohon Monte Carlo memenuhi syarat sebagai pembelajaran mesin?

Untuk yang terbaik dari pemahaman saya, algoritma pencarian pohon Carlo Carlo (MCTS) adalah alternatif untuk minimum untuk mencari pohon node. Ini bekerja dengan memilih langkah (umumnya, yang memiliki peluang tertinggi untuk menjadi yang terbaik), dan kemudian melakukan permainan acak saat bergerak untuk melihat apa hasilnya. Proses ini berlanjut untuk jumlah …

9 machine-learning reinforcement-learning game-ai monte-carlo-tree-search alphazero

5

Apa sumber yang bagus untuk membiasakan diri dengan pembelajaran penguatan?

Saya akrab dengan pembelajaran yang diawasi dan tidak diawasi. Saya melakukan kursus SaaS yang dilakukan oleh Andrew Ng di Coursera.org. Saya mencari sesuatu yang serupa untuk pembelajaran penguatan. Bisakah Anda merekomendasikan sesuatu?

8 reinforcement-learning getting-started

1

Apakah ada model pembelajaran mesin lain selain dari Reinforcement Learning dan Q Learning untuk bermain video game?

OpenAI's Universe menggunakan algoritma RL dan saya telah mendengar beberapa proyek pelatihan game menggunakan pembelajaran Q, tetapi apakah ada yang lain yang digunakan untuk menguasai / memenangkan permainan? Bisakah algoritma genetika digunakan untuk menang dalam suatu game?

8 machine-learning reinforcement-learning genetic-algorithms game-theory

1

Mengenal ruang tindakan / keadaan berkelanjutan MDP dan Penguatan Pembelajaran

Sebagian besar pengantar bidang MDP dan pembelajaran Penguatan fokus secara eksklusif pada domain di mana variabel ruang dan tindakan adalah bilangan bulat (dan terbatas). Dengan cara ini kami diperkenalkan dengan cepat ke Iterasi Nilai, Q-Learning, dan sejenisnya. Namun aplikasi yang paling menarik (misalnya, helikopter terbang ) RL dan MDP melibatkan …

8 research reinforcement-learning control-problem

Pertanyaan yang diberi tag «reinforcement-learning»