Karena manusia tidak memiliki kemampuan untuk mencari dalam, seperti program catur komputer tradisional (fritz, stockfish et al), mereka menciptakan 'prinsip strategis' atau aturan praktis (kontrol pusat, pengembangan, keselamatan raja) dan konsep atau trik yang dapat diterapkan dalam berbagai macam situasi dengan cara yang berbeda, seperti pengorbanan, benteng-benteng terhubung, pasangan uskup, ujung-ujung khusus misalnya bagaimana memojokkan raja dengan benteng dan bidak.
Saya pikir alpha zero telah secara mandiri menemukan kembali banyak konsep (persepsi dan konsep) dan juga telah belajar banyak konsep baru - karena pengetahuannya tidak diperlukan untuk dibangun di atas fungsi evaluasi manusia dan pencarian minmax yang kuat yang selalu mengasumsikan bahwa lawan adalah jenius.
Tentu saja, prinsip-prinsip seperti itu sendiri bertentangan dalam beberapa situasi, itulah sebabnya berbagai permainan pembukaan dan perangkap dipelajari dengan cermat - misalnya jangan mengembangkan ratu terlalu cepat.
Di sisi lain, manusia juga memperhatikan bahwa sekali Anda kehilangan satu bagian (tanpa pertukaran) Anda melemahkan kekuatan Anda sehingga mereka sangat berhati-hati untuk tidak kehilangan bagian tanpa kompensasi.
Saya pikir permainan Alphazero telah membebaskan catur komputer (dan catur manusia) dari rasa takut yang besar akan kehilangan materi kecil dan ketergantungan pada pembukaan buku dan nilai karya.
Permainan Alphazero menunjukkan hal-hal seperti 'prinsip strategis' seperti kontrol pusat, pengembangan, ruang, inisiatif jauh lebih penting jika lawan Anda ceroboh. Dengan kata lain, 'pengorbanan' bukan benar-benar pengorbanan tetapi menukar sepotong demi mendapatkan inisiatif, posisi, langkah terarah.
Alphago (bukan nol) mengandalkan evaluasi manusia, tetapi alphazero mengatur seluruh rantai evaluasi untuk 'pencarian atau simulasi' sebagai proses ujung ke ujung yang tunggal dan menghasilkan cara bermain yang sama sekali baru.
Jika Anda berpikir tentang hal itu, tuan-tuan hebat di masa lalu seperti Morphy, Fischer, Kasparov telah diberi tepuk tangan karena permainan -counter-intuitif-seperti ini di mana mereka tidak dibatasi oleh evaluasi tertulis-di-batu dengan memanfaatkan situasi khusus yang muncul. Saya pikir game alpha zero memiliki faktor 'wow' untuk itu.
Mengapa jaringan saraf. Sementara program komputer yang menggunakan representasi simbolis dan pencarian diskrit hanya dapat menggunakan cara berpikir 'satu', jaringan saraf dapat secara paralel memproses situasi dengan evaluasi alternatif yang bertentangan dan beralih ke tampilan yang lebih bernilai di lapisan selanjutnya.