Kecerdasan buatan game-ai

4

Bagaimana cara menangani gerakan yang tidak valid dalam pembelajaran penguatan?

Saya ingin membuat AI yang bisa memainkan lima-dalam-baris / gomoku. Seperti yang saya sebutkan dalam judul, saya ingin menggunakan pembelajaran penguatan untuk ini. Saya menggunakan metode gradien kebijakan , yaitu REINFORCE, dengan baseline. Untuk perkiraan nilai dan fungsi kebijakan, saya menggunakan jaringan saraf . Ini memiliki lapisan convolutional dan sepenuhnya …

20 machine-learning reinforcement-learning game-ai combinatorial-games

3

Bagaimana cara memilih algoritma terbaik untuk permainan papan seperti catur?

Bagaimana cara memilih algoritma terbaik untuk permainan papan seperti catur? Sejauh ini, saya hanya mempertimbangkan tiga algoritma, yaitu, minimax, pemangkasan alpha-beta, dan pencarian pohon Monte Carlo (MCTS). Rupanya, pemangkasan alpha-beta dan MCTS adalah ekstensi dari algoritma minimax dasar.

15 game-ai minimax alpha-beta-pruning monte-carlo-tree-search

2

Pengkodean input / output untuk jaringan saraf untuk mempelajari permainan berbasis grid

Saya menulis permainan mainan sederhana dengan tujuan melatih jaringan saraf yang mendalam di atasnya. Aturan permainan kira-kira adalah sebagai berikut: Gim ini memiliki papan yang terdiri dari sel-sel heksagonal. Kedua pemain memiliki koleksi potongan yang sama yang dapat mereka pilih untuk diposisikan secara bebas di papan tulis. Menempatkan berbagai jenis …

13 neural-networks deep-learning game-ai

2

Apakah AlphaZero adalah contoh AGI?

Dari makalah penelitian DeepMind di arxiv.org: Dalam tulisan ini, kami menerapkan algoritma yang sama tetapi sepenuhnya generik, yang kami sebut AlphaZero , untuk permainan catur dan shogi serta Go, tanpa pengetahuan domain tambahan selain aturan permainan, menunjukkan bahwa pembelajaran penguatan tujuan umum algoritma dapat mencapai, tabula rasa, kinerja manusia super …

11 game-ai definitions agi alphago

3

Bagaimana cara melatih jaringan saraf untuk permainan papan berbasis bulat?

Saya bertanya-tanya bagaimana cara melatih jaringan saraf untuk permainan papan berbasis bulat seperti, tic-tac-toe, catur, risiko atau permainan berbasis putaran lainnya. Mendapatkan langkah selanjutnya dengan inferensi tampaknya cukup mudah, dengan memberi makan status permainan sebagai input dan menggunakan output sebagai langkah untuk pemain saat ini. Namun melatih AI untuk tujuan …

11 training tensorflow game-ai

4

Bisakah jaringan saraf bekerja di luar konsep jarak?

Bayangkan sebuah game di mana itu adalah layar hitam selain dari piksel merah dan piksel biru. Mengingat permainan ini untuk manusia, pertama-tama mereka akan melihat bahwa menekan tombol panah akan memindahkan piksel merah. Hal berikutnya yang akan mereka coba adalah memindahkan piksel merah ke piksel biru. Berikan game ini ke …

10 neural-networks game-ai path-planning teaching-concepts

1

Beberapa keraguan tentang penerapan pembelajaran penguatan untuk permainan seperti catur

Saya menemukan permainan papan catur. Saya membangun mesin sehingga bisa bermain secara otonom. Mesin pada dasarnya adalah pohon keputusan. Ini disusun oleh: Fungsi pencarian yang di setiap node menemukan semua langkah hukum yang mungkin Fungsi evaluasi yang memberikan nilai numerik ke posisi dewan (positif berarti pemain pertama unggul, negatif berarti …

9 reinforcement-learning game-ai game-theory combinatorial-games negamax

3

Apakah pencarian pohon Monte Carlo memenuhi syarat sebagai pembelajaran mesin?

Untuk yang terbaik dari pemahaman saya, algoritma pencarian pohon Carlo Carlo (MCTS) adalah alternatif untuk minimum untuk mencari pohon node. Ini bekerja dengan memilih langkah (umumnya, yang memiliki peluang tertinggi untuk menjadi yang terbaik), dan kemudian melakukan permainan acak saat bergerak untuk melihat apa hasilnya. Proses ini berlanjut untuk jumlah …

9 machine-learning reinforcement-learning game-ai monte-carlo-tree-search alphazero

Pertanyaan yang diberi tag «game-ai»