Pertanyaan yang diberi tag «combinatorial-games»

4
Bagaimana cara menangani gerakan yang tidak valid dalam pembelajaran penguatan?
Saya ingin membuat AI yang bisa memainkan lima-dalam-baris / gomoku. Seperti yang saya sebutkan dalam judul, saya ingin menggunakan pembelajaran penguatan untuk ini. Saya menggunakan metode gradien kebijakan , yaitu REINFORCE, dengan baseline. Untuk perkiraan nilai dan fungsi kebijakan, saya menggunakan jaringan saraf . Ini memiliki lapisan convolutional dan sepenuhnya …


1
Beberapa keraguan tentang penerapan pembelajaran penguatan untuk permainan seperti catur
Saya menemukan permainan papan catur. Saya membangun mesin sehingga bisa bermain secara otonom. Mesin pada dasarnya adalah pohon keputusan. Ini disusun oleh: Fungsi pencarian yang di setiap node menemukan semua langkah hukum yang mungkin Fungsi evaluasi yang memberikan nilai numerik ke posisi dewan (positif berarti pemain pertama unggul, negatif berarti …
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.