Saya tertarik pada Pembelajaran (Jauh) Penguatan (RL) . Sebelum menyelam ke bidang ini, haruskah saya mengambil kursus di Game Theory (GT) ?
Bagaimana hubungan GT dan RL ?
Saya tertarik pada Pembelajaran (Jauh) Penguatan (RL) . Sebelum menyelam ke bidang ini, haruskah saya mengambil kursus di Game Theory (GT) ?
Bagaimana hubungan GT dan RL ?
Jawaban:
Dalam Reinforcement Learning (RL), adalah umum untuk membayangkan Markov Decision Process (MDP) yang mendasarinya. Maka tujuan RL adalah untuk mempelajari kebijakan yang baik untuk MDP, yang seringkali hanya ditentukan sebagian. MDP dapat memiliki tujuan yang berbeda seperti total, rata-rata, atau hadiah diskon, di mana hadiah diskon adalah asumsi paling umum untuk RL. Ada ekstensi MDP yang dipelajari dengan baik untuk pengaturan dua pemain (yaitu, game); lihat, misalnya,
Filar, Jerzy, dan Koos Vrieze. Proses pengambilan keputusan Markov yang kompetitif . Springer Science & Business Media, 2012.
Ada teori dasar yang dibagikan oleh MDP dan ekstensi mereka ke dua pemain (zero-sum) game, termasuk, misalnya, teorema titik tetap Banach, Iterasi Nilai, Optimalitas Bellman, Iterasi Kebijakan / Peningkatan Strategi dll. Namun, saat ada koneksi dekat ini antara MDP (dan karenanya RL) dan jenis game khusus ini:
Teori permainan cukup terlibat dalam konteks Multi-agent Reinforcement learning (MARL).
Lihatlah permainan stokastik atau baca artikel An Analysis of Stochastic Game Theory untuk Pembelajaran Penguatan Multi Agen .
Saya tidak akan melihat GT sebagai prasyarat untuk RL. Namun, ini memberikan ekstensi yang bagus untuk kasus multi-agen.
RL: Agen tunggal dilatih untuk memecahkan masalah keputusan Markov (MDPS). GT: Dua agen dilatih untuk menyelesaikan Game. Pembelajaran Penguatan multi-agen (MARL) dapat digunakan untuk menyelesaikan untuk game stokastik.
Jika Anda tertarik dengan aplikasi agen tunggal RL dalam pembelajaran mendalam, maka Anda tidak perlu mengikuti kursus GT. Untuk dua atau lebih agen, Anda mungkin perlu mengetahui teknik teori permainan.