Di sini Anda memiliki beberapa referensi bagus tentang Pembelajaran Penguatan:
Klasik
Sutton RS, Barto AG. Pembelajaran Penguatan: Suatu Pengantar. Cambridge, Mass: Buku Bradford; 1998. 322 hal.
Draf untuk edisi kedua tersedia gratis: http://incompleteideas.net/book/the-book-2nd.html
Russell / Norvig Bab 21:
Russell SJ, Norvig P, Davis E. Kecerdasan buatan: pendekatan modern. Upper Saddle River, NJ: Prentice Hall; 2010
Lebih teknis
Szepesvári C. Algoritma untuk pembelajaran penguatan. Kuliah Sintesis tentang Kecerdasan Buatan dan Pembelajaran Mesin. 2010; 4 (1): 1-103. http://www.ualberta.ca/~szepesva/RLBook.html
Bertsekas DP. Pemrograman Dinamis dan Kontrol Optimal. Edisi ke-4. Belmont, Mass .: Athena Scientific; 2007. 1270 p.
Bab 6, vol 2 tersedia gratis: http://web.mit.edu/dimitrib/www/dpchapter.pdf
Untuk perkembangan terbaru
Wiering M, van Otterlo M, editor. Pembelajaran Penguatan. Berlin, Heidelberg: Springer Berlin Heidelberg; 2012 Tersedia dari: http://link.springer.com/10.1007/978-3-642-27645-3
Kochenderfer MJ, Amato C, Chowdhary G, Bagaimana JP, Reynolds HJD, Thornton JR, dkk. Pengambilan Keputusan Di Bawah Ketidakpastian: Teori dan Aplikasi. 1 edisi. Cambridge, Massachusetts: The MIT Press; 2015. 352 hal.
Pembelajaran penguatan multi-agen
Buşoniu L, Babuška R, Schutter BD. Pembelajaran Penguatan Multi-agen: Tinjauan. Dalam: Srinivasan D, Jain LC, editor. Inovasi dalam Sistem dan Aplikasi Multi-Agen - 1. Springer Berlin Heidelberg; 2010 hal. 183–221. Tersedia di: http://link.springer.com/chapter/10.1007/978-3-642-14435-6_7
Schwartz HM. Pembelajaran mesin multi-agen: pendekatan penguatan. Hoboken, New Jersey: Wiley; 2014
Video / Kursus
Saya juga akan menyarankan kursus David Silver di YouTube: https://www.youtube.com/playlist?list=PL5X3mDkKaJrL42i_jhE4N-p6E2Ol62Ofa