Saat ini saya sedang mencari Tinjauan atas Algoritma Pembelajaran Penguatan dan mungkin klasifikasi mereka. Tetapi di sebelah Sarsa dan Q-Learning + Deep Q-Learning saya tidak dapat menemukan algoritma yang populer.
Wikipedia memberi saya gambaran tentang Metode Pembelajaran Penguatan umum yang berbeda tetapi tidak ada referensi untuk algoritma yang berbeda yang menerapkan metode ini.
Tapi mungkin saya membingungkan pendekatan umum dan algoritma dan pada dasarnya tidak ada klasifikasi nyata di bidang ini, seperti di bidang pembelajaran mesin lainnya. Bisakah seseorang memberi saya pengantar singkat atau hanya referensi di mana saya bisa mulai membaca pendekatan yang berbeda, perbedaan antara mereka dan contoh algoritma yang menerapkan pendekatan ini?