Saya bertanya-tanya bagaimana cara melatih jaringan saraf untuk permainan papan berbasis bulat seperti, tic-tac-toe, catur, risiko atau permainan berbasis putaran lainnya. Mendapatkan langkah selanjutnya dengan inferensi tampaknya cukup mudah, dengan memberi makan status permainan sebagai input dan menggunakan output sebagai langkah untuk pemain saat ini. Namun melatih AI untuk tujuan itu tampaknya tidak lurus ke depan, karena:
- Mungkin tidak ada peringkat jika satu gerakan baik atau tidak, jadi pelatihan gerakan tunggal tampaknya bukan pilihan yang tepat
- Menggunakan semua status permainan (input) dan gerakan (output) dari seluruh permainan untuk melatih jaringan saraf, tampaknya bukan pilihan yang tepat karena tidak semua gerakan dalam game yang hilang mungkin buruk
Jadi saya bertanya-tanya bagaimana cara melatih jaringan saraf untuk permainan papan berbasis bulat? Saya ingin membuat jaringan saraf untuk tic-tac-toe menggunakan tensorflow.