EDIT
@ tautan unutbu dalam komentar adalah bacaan pengantar yang bagus.
Pemahaman yang kuat untuk AlphaZero kemungkinan besar membutuhkan gelar kuantitatif (PhD?). Apakah Anda meminta kursus kilat di AlphaZero?
Harap dicatat kecuali jika Anda berinvestasi signifikan jumlah waktu Anda, tidak ada yang saya katakan akan bekerja. Tidak ada buku yang mungkin bisa membahas semuanya. Anda harus bekerja sangat keras.
Mari kita coba. Crash course untuk AlphaZero.
1. Pemahaman dasar dalam pembelajaran mesin
Tak terhitung banyaknya buku. Tetapi jika Anda tidak punya waktu, saya akan merekomendasikan kursus pembelajaran mesin Profesor Andrew Ng di Coursera.
Kata kunci Anda: set pelatihan, set tes, penurunan gradien stokastik, laju pembelajaran, GPU, fungsi biaya, cross entropy .
2. Jaringan netral dalam
Anda perlu memahami tentang jaringan saraf. Saya akan merekomendasikan buku pembelajaran mendalam Profesor Ian Goodfellow jika Anda serius. Jika Anda tidak punya waktu, silakan ikuti lagi kursus online Profesor Andrew Ng di Coursera. Anda tidak harus membaca semua bab (tetapi Anda harus!).
YouTube memiliki banyak pengenalan cepat ke jaringan saraf, cobalah.
Kata kunci Anda: neuron, layer, bobot, bias, mini-batch, aktivasi .
3. Pencarian Pohon Monte Carlo
Anda harus mengerti apa itu Monte Carlo. Buku-buku tentang Monte Carlo ada di mana-mana di Amazon. Baca wikipedia tentang MCTS jika Anda tidak punya waktu.
Kata kunci Anda: pengambilan sampel, ekspansi, simulasi, peluncuran, backpropagation .
3. Pembelajaran penguatan
Kata kunci Anda: gradien kebijakan, gradient descent, tingkat pembelajaran
5. Representasi papan catur
Makalah itu sendiri paling sederhana. Model ini mengkodekan status papan (misalnya potongan) sebagai serangkaian nilai biner penyandian satu-panas.
6. MCTS vs alpha-beta