Mempelajari aturan catur


11

Sebuah pertanyaan serupa menanyakan apakah komputer dapat belajar untuk bermain secara optimal dalam catur dengan menganalisis ribuan permainan.

Jika sebuah mesin dapat melihat keadaan papan untuk beberapa permainan catur (atau beberapa permainan catur) di awal dan setelah setiap gerakan, dapatkah diprogram untuk mempelajari aturan permainan?

Jika bisa, sampai sejauh mana (misalnya, apakah itu bisa dipertanggungjawabkan untuk pemeran atau promosi) apakah ini akan berhasil? Algoritma pembelajaran mesin mana yang memungkinkan ini terjadi?


3
Mesin tersebut seharusnya dapat mencapai kondisi di mana ia dapat berkata "Saya telah melihat langkah ini dilakukan, jadi saya akan berasumsi saya dapat melakukannya dalam keadaan yang sama." Apakah itu merupakan "mempelajari aturan" adalah pertanyaan filosofis. ;)
deceze

@ Terima Nah, Anda tidak sepenuhnya benar. Dengan mempelajari aturan, satu berarti bisa bergerak mengingat tata letak yang tidak pernah terjadi pada program sebelumnya. Kalau tidak, ia tidak mempelajari aturan tetapi menghafal gerakan.

2
@ Max Apakah komputer dapat dengan benar melakukan gerakan yang belum pernah dilihat sebelumnya? Katakanlah, itu telah melihat ksatria bergerak dua maju dan satu ke sisi berkali-kali, tetapi tidak pernah dua kembali, satu ke samping. Bagaimana bisa dengan yakin mengatakan apa aturannya mengenai pergerakan ksatria? Mungkin ada klausul khusus dalam aturan yang menyatakan "ksatria tidak bisa mundur, hanya maju" (seperti pion). Karenanya, mendeduksi aturan dengan kepastian sepertinya hal yang mustahil. Itu juga berlaku untuk manusia.
menipu

8
@ Max Bahkan, mungkin ada sejumlah aturan tak terbatas yang tidak bisa disimpulkan komputer . On the 8th turn the knight may not turn right. On a sunny day the pawns may jump over bishops.Komputer tidak bisa mengatakan mengapa pion itu tidak bergerak pada belokan tertentu. Mungkin ada aturan yang melarangnya bergerak dalam keadaan khusus itu. Oleh karena itu, komputer seharusnya hanya dapat mereproduksi pola yang sama (sebenarnya, tepat), tetapi tidak pernah dapat menyimpulkan aturan dengan kepercayaan 100%.
menipu

@ menerima Ya itu bisa jika Anda menunjukkan aturan itu entah bagaimana. Cara yang sama seperti Anda perlu mengajari manusia aturan (misalnya, berikan dia printout aturan untuk dibaca) Anda perlu entah bagaimana memberikan aturan itu ke mesin. Cara termudah adalah memutar ulang SEMUA aturan di sejumlah game untuk dipelajari mesin. Sama halnya dengan manusia - manusia tidak akan tahu bahwa On a sunny day the pawns may jump over bishops.jika Anda tidak pernah menunjukkan itu padanya.

Jawaban:


10

Jika sebuah mesin dapat melihat keadaan papan untuk beberapa permainan catur (atau beberapa permainan catur) di awal dan setelah setiap gerakan, dapatkah diprogram untuk mempelajari aturan permainan?

Tentu tidak untuk beberapa permainan catur; Anda perlu menganalisis jumlah yang sangat besar untuk menghentikannya dari membuat gerakan yang tidak valid. Seberapa banyak, saya tidak tahu; masalah ini termasuk dalam bidang teori pembelajaran komputasi, pembelajaran PAC dan masalah kemampuan belajar dalam batas .

Algoritme klasifikasi yang disarankan oleh poster lain mungkin dapat mempelajari aturan catur secara diskriminatif : dengan dua pengaturan papan, mereka mungkin menjawab "ya" atau "tidak" untuk pertanyaan apakah langkah yang valid mengubah satu ke yang lain. Dengan sedikit usaha, mereka mungkin juga digunakan untuk menghasilkan gerakan. Namun, mereka hanya akan menghasilkan gerakan yang mereka lihat dalam permainan yang telah mereka latih, atau menghasilkan kombinasi gerakan yang valid dan tidak valid, masing-masing dengan skor yang menyatakan seberapa besar kemungkinan mereka mempertimbangkan perpindahan tersebut, dengan aturan yang tidak valid semoga mendapatkan probabilitas yang sangat kecil.

(Yaitu, salah satu program tidak akan mengenali beberapa langkah yang valid yang tersedia; atau Anda mungkin bisa menipu tanpa memperhatikan; atau Anda harus melatihnya begitu lama sehingga Anda kehilangan semua minat dalam permainan.)

Untuk teknik yang dapat mempelajari aturan, periksa pemrograman logika induktif dan pemrograman genetik . Saya tidak yakin apakah ada yang pernah mencoba menerapkannya pada pembelajaran catur; karena aturan catur sudah ditetapkan, akan jauh lebih menarik (bahkan untuk akademisi) untuk membangun program bermain catur yang baik daripada yang harus mempelajari aturan dasar dari awal.


4

Aturan catur cukup rumit dan beberapa sangat jarang dieksekusi dalam permainan.

Misalnya aturan en passant . Berapa banyak permainan yang perlu Anda amati untuk menyimpulkan itu hanya diperbolehkan langkah pertama setelah langkah dua langkah maju?

Contoh lain. B-square dapat diserang dalam kastil yang panjang. Berapa banyak permainan yang Anda lihat di mana ini terjadi?

Dengan kata lain Anda akan membutuhkan banyak, banyak, banyak permainan untuk mendapatkan semua aturan dengan benar.

Tapi, mungkin, Google akan menemukan sudut awan mereka untuk arsip permainan catur yang lengkap "segera" ...


"B-square bisa diserang dalam kastil yang panjang" langkah apa ini? Bisakah Anda menjelaskannya atau menautkannya untuk saya?
CaffGeek

@chad, juga disebut castling queenside - notasi "0-0-0" digunakan. Hanya tiga bidang yang "disentuh" ​​raja yang mungkin tidak diserang.

2
Juga, d-square tidak dapat diserang ketika castling queenside (atau f-square ketika castling kingside) ; kamu juga tidak bisa kastil setelah memindahkan rajamu. Bagaimana Anda bisa tahu bahwa sesuatu tidak dapat dilakukan dengan mengamati game di mana itu tidak dilakukan? Seperti yang disebutkan Lars, komputer dapat menetapkan probabilitas bahwa suatu langkah valid, tetapi memastikan bahwa aturan tertentu dengan mengamati game berbatasan dengan hal yang mustahil.
BlueRaja - Danny Pflughoeft

Juga, ada permainan, bahkan oleh grandmaster di pengaturan turnamen, di mana aturan telah dilanggar , dan tidak ada pemain yang memperhatikan! Menurut aturan turnamen, jika tidak ada pemain yang melihat dalam 10 gerakan, permainan ini sah dan berlanjut. (Saya sangat ingat permainan di mana seorang grandmaster memindahkan rajanya, kemudian memindahkannya kembali, dan kemudian mengebornya. Namun, saya tidak dapat menemukannya sekarang)
BlueRaja - Danny Pflughoeft

1
id pelintas cukup langka tetapi ada beberapa aturan undian paksa yang JAUH lebih jarang. Saya telah bermain selama 40 tahun dan saya belum pernah melihat permainan di mana Anda bisa mendapatkan hasil seri dengan 50 gerakan tanpa pion dan tanpa tangkapan. Saya pikir ada satu aturan lagi yang bahkan saya tidak ingat. Dalam latihan, para pemain akan menyetujui pengundian sebelum mereka dipanggil. (Mereka ada untuk memastikan bahwa Anda tidak dapat "memenangkan" posisi yang ditarik dengan menyeretnya keluar sampai lawan Anda berhenti.)
Loren Pechtel

2

Iya dan tidak

Saya tidak yakin apakah Anda bertanya apakah mungkin untuk mempelajari aturan catur menggunakan pembelajaran mesin / jaringan saraf atau apakah mungkin untuk melatih mesin catur tingkat "grand master" yang menggunakannya.

Anda tentu bisa mengajarkan komputer aturan dan beberapa level catur menggunakan itu. Namun saya tidak berpikir Anda bisa melatihnya ke tingkat yang lebih tinggi menggunakannya. Ilmu Komputer belum afaik gagal menghasilkan mesin yang dapat "memahami" catur dari sudut pandang posisi / intuitif. Semua komputer catur saat ini menggunakan database yang luas, perhitungan brute force dan kemungkinan pembelajaran mesin di atas itu.

Kira itu tergantung apakah Anda menghitung menggunakan basis data referensi sebagai selingkuh atau tidak :) Juga, sulit untuk mengetahui apakah Anda benar-benar dapat memisahkan mengetahui banyak gim dari permainan yang bagus. Manusia yang pandai catur itu baik justru karena mereka telah melihat begitu banyak permainan yang direferensikan oleh bagian otak yang biasanya dikenal untuk mengenali wajah. Dari ingatan ini tampaknya pemain catur manusia mampu mengembangkan "intuisi" dari kekuatan suatu posisi.


grandmaster terbaik menghafal buku-buku pembuka yang luas dan itu tidak dianggap curang. Lagi pula, itu terjadi sepanjang waktu bahwa apa yang pernah dianggap sebagai variasi pembukaan yang baik akan dirusak oleh ide baru. Jadi "cheat" dari memainkan buku bergerak mungkin bahkan bukan cara optimal bagi komputer untuk bermain.
Kevin

2

Seperti yang dikatakan oleh banyak komentar, ini hampir merupakan pertanyaan filosofis yang memperdebatkan definisi 'belajar'. Sebagian besar program kecerdasan buatan bergantung pada penentuan solusi rasional. Dengan data yang cukup, program catur catur akan menentukan daftar gerakan yang rasional untuk dilakukan dalam situasi tertentu. Ini tidak berarti bahwa ia mengetahui aturan catur, ia hanya memahami gerakan apa yang menguntungkan dan mana yang tidak. Sekalipun kumpulan data termasuk pemain yang membuat langkah ilegal, langkah ilegal akan menyebabkan kerugian instan sehingga ai akan mengabaikannya dan tidak pernah menggunakan langkah itu karena itu tidak pernah menguntungkan.

Tidak masalah apakah jaringan saraf atau algoritma evolusioner atau jenis algoritma pembelajaran apa pun digunakan, suatu ai tidak pernah dapat secara eksplisit mempelajari aturan dari menonton sesuatu, ia hanya dapat menentukan daftar opsi yang menguntungkan secara rasional.


2

Jika Anda menganggap aturan Catur sebagai mesin fisika permainan dan Hukum Fisika sebagai aturan alam semesta yang diterima dan tidak membungkuk, maka pikirkan tentang betapa sedikitnya "Hukum" yang ada di alam semesta alami kita. Sangatlah sulit jika bukan tidak mungkin membuat ATURAN keras dan cepat, tetapi kita dapat membuat sejumlah teori yang diuji dan diterima pada titik waktu tertentu.

BISA dimungkinkan dengan asumsi bahwa komputer mengamati dan mencatat gerakan, tetapi TIDAK membuat pernyataan tentang gerakan yang sah secara langsung.

Misalnya, ia akan mengamati pion yang bergerak maju satu bagian dan membuat hipotesis baru bahwa semua bagian dapat bergerak maju hanya satu ruang, dan yang lain bahwa gadai dapat bergerak maju hanya satu ruang. Itu akan membentuk sebanyak mungkin hipotesa restriktif hingga langkah selanjutnya terjadi dan beberapa di antaranya bisa dilemparkan atau dibuat lebih liberal.

Akhirnya setelah begitu banyak gerakan Anda akan memiliki satu set teori yang kuat tetapi itu akan menjadi dataset hidup mendekati 0 tetapi tidak pernah mencapainya.

Jadi jawabannya adalah bahwa komputer bisa membuat tebakan yang benar-benar bagus tetapi akan (EDIT: TIDAK) tahu aturannya dengan pasti.


1

Secara teori - ya itu bisa. Bahkan bisa menjadi grandmaster dalam catur. Jawaban yang Anda cari adalah jaringan saraf . Jaringan saraf pada dasarnya adalah hal yang sama yang terjadi di dalam otak kita. Selain itu, mengingat jaringan saraf yang dirancang dengan sempurna (baca - mustahil) dan perangkat keras yang sempurna - dapat mempelajari segala hal yang dapat dipelajari manusia dengan cara yang sama atau bahkan lebih baik.

Baca lebih lanjut tentang itu:


2
"Jawaban" ini hanyalah sekumpulan tautan Wikipedia, dua di antaranya menggambarkan konsep yang sama, satu di antaranya sangat luas, dan satu di antaranya tidak ada hubungannya dengan masalah yang dihadapi. Tolong tunjukkan bagaimana peta Kohonen akan digunakan untuk belajar secara efektif mempelajari aturan catur.
Fred Foo

1
JST dan JST tidak jauh dari kompleksitas neuron / otak manusia yang sebenarnya, JST yang terbaik adalah perkiraan kasar yang mengerikan.
Darknight

"Dalam teori, teori dan praktik adalah sama, tetapi dalam praktiknya tidak pernah sama." Program catur dapat dimainkan seperti grandmaster, tapi saya rasa itu bukan karena jaringan saraf atau pembelajaran mesin. Sebagian besar program yang baik menggunakan buku pembuka yang luas, tabulasi endgame, dan pencarian pertama yang mendalam ("negamax dengan pemangkasan alpha beta"), dan mungkin fungsi evaluasi yang sangat rumit (yang kemungkinan besar ditulis dengan bantuan grandmaster).
Kevin

Jaringan saraf hanya bisa mempelajari apa yang mereka latih. Catur memiliki beberapa aturan yang sangat jarang diterapkan, tetapi bagian dari permainan. Apakah sah untuk dipromosikan menjadi uskup? Apakah sah untuk mempromosikan menjadi raja?

2
Ha ... mempromosikan menjadi raja membuat skakmat sedikit lebih sulit!
Kevin

1

Saya pikir itu bisa mempelajari gerakan yang diizinkan dibuat hanya dengan menganalisis, tetapi bagaimana ia mempelajari gerakan yang tidak diizinkan dilakukannya? Sebagai contoh, pion sepertinya tidak pernah bergerak maju satu kotak ketika bagian yang berlawanan ada di depannya. Bagaimana komputer tahu apakah ini pilihan pemain atau tidak diizinkan melakukannya? Anda dapat menemukan beberapa algoritma yang mengatakan jika 99,99% dari waktu atau lebih besar suatu peristiwa tidak terjadi maka itu berarti Anda tidak diperbolehkan untuk melakukannya, tetapi bisa juga itu 99,99% dari waktu yang dianggap sebagai langkah buruk, tapi itu 0,01% dari waktu itu adalah langkah yang memenangkan permainan. Jadi, jawaban saya adalah tidak, itu tidak bisa mempelajari semua aturan hanya dengan menganalisis game, tetapi mungkin bisa belajar cukup banyak untuk memainkan game.


1

Ini adalah pertanyaan filosofis. Anda mungkin juga bertanya apakah seseorang dapat belajar bermain catur hanya dengan mengamati orang saat mereka bermain catur. Bahkan pada dasarnya ini adalah jenis pertanyaan yang sama yang ditanyakan Nelson Goodman dalam bukunya yang hebat Fact, Fiction, dan Forecast : bagaimana kita bisa beralih dari serangkaian pengamatan terbatas yang telah dibuat ke prediksi pengamatan di masa depan. Pengamatan yang sudah dilakukan akan menjadi gerakan catur yang diamati sejauh ini dan pengamatan di masa depan akan menjadi semua gerakan catur yang belum terjadi. Pertanyaannya adalah, adakah hubungan nomologis antara pengamatan masa lalu dan pengamatan masa depan (sebagai lawan dari hubungan sebab akibat murni antara peristiwa masa lalu dan peristiwa masa depan)?

Jika kita menafsirkan kata nomologis sebagai hukum alam atau logika dan tidak ada yang bisa terjadi bertentangan dengan hukum ini maka, tentu saja tidak ada hubungan seperti itu, karena orang pertama yang menggerakkan kastil secara diagonal, akan melanggar hukum alam dan alam semesta seperti yang kita tahu akan runtuh.

Tetapi bahkan jika, pada kenyataannya, oleh suatu kecelakaan alam yang aneh, setiap gerakan yang dilakukan oleh setiap pemain catur di dunia mulai sekarang, adalah sah (tidak ada yang akan melakukan kesalahan atau mencoba menipu dan bahkan orang yang tidak mengerti tentang aturan catur) akan mulai mendorong bidak catur secara acak di seluruh papan, tetapi secara tidak sengaja selalu menurut aturan), yang tidak akan meyakinkan kita bahwa ada hukum alam (atau hukum logika) yang memaksa semua ini. Kami menganggapnya murni kebetulan.

Ludwig Wittgenstein meliput landasan serupa dalam Investigasi Filsafatnya . Dia menegaskan bahwa setiap rangkaian pengamatan sesuai dengan banyak aturan, dan bahkan bertentangan, sewenang-wenang. Misalnya, jika semua permainan catur yang saya amati akan terjadi di sore hari, maka peraturan saya bisa di sore hari uskup hanya dapat dipindahkan secara diagonal . Bahwa waktu hari itu tidak penting untuk permainan adalah sesuatu yang tidak bisa saya amati karena saya belum mengamati permainan catur pada waktu yang berbeda dalam sehari. Atau, kebetulan, jika saya tidak pernah mengamati seorang wanita bermain catur, maka aturannya bisa jadi uskup hanya bisa digerakkan oleh laki-laki sama sekali. Apa yang relevan dengan pengamatan dan apa yang tidak ditentukan sebagai prasyarat untuk pengamatan dan tidak dapat menjadi bagian dari pengamatan itu sendiri.

BTW: Solusi Wittgenstein untuk masalah ini sangat mirip dengan Goodman. Saya tidak akan merusak kejutannya;-)

Tambahan:

Pada hari-hari ketika Sussman adalah seorang pemula, Minsky pernah datang kepadanya ketika ia duduk meretas di PDP-6.

"Apa yang kamu lakukan?", Tanya Minsky. "Saya melatih jaring saraf kabel secara acak untuk memainkan Tic-tac-toe", jawab Sussman. "Mengapa jaring itu diacak secara acak?", Tanya Minsky. "Saya tidak ingin itu memiliki prasangka bagaimana bermain", kata Sussman.

Minsky lalu menutup matanya. "Kenapa kamu menutup mata?" Sussman bertanya pada gurunya. "Supaya ruangan itu kosong." Pada saat itu, Sussman tercerahkan.


-4

Tidak

Karena hanya mempelajari pola (melalui metode mana pun) tidak sama dengan "belajar bermain catur secara optimal".

Ini membutuhkan perencanaan & Strategi, yang sangat berbeda dari hanya sekedar belajar mengatur pola.


1
Anda sebenarnya tidak tahu itu; selain itu, pertanyaannya adalah apakah mungkin (untuk komputer, tetapi kendala yang sama mungkin juga berlaku untuk manusia) untuk mempelajari aturan catur yang sebenarnya hanya dengan menganalisis contoh game.
tdammers

1
Saya pikir Anda salah memahami pertanyaan ...
maple_shaft

Setelah bekerja (menguasai tesis) dengan AI (jaringan saraf), saya cukup yakin itu tidak bisa. Kecuali Anda memiliki bukti untuk mengatakan sebaliknya, Anda tidak bisa hanya mengatakan "Anda tidak tahu itu"
Darknight
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.