Apa sumber yang bagus untuk membiasakan diri dengan pembelajaran penguatan?


8

Saya akrab dengan pembelajaran yang diawasi dan tidak diawasi. Saya melakukan kursus SaaS yang dilakukan oleh Andrew Ng di Coursera.org.

Saya mencari sesuatu yang serupa untuk pembelajaran penguatan.

Bisakah Anda merekomendasikan sesuatu?

Jawaban:


5

Untuk jawaban yang baik di sini, saya akan menambahkan

Ini hampir tidak menggores permukaan RL, tetapi mereka harus membantu Anda memulai.


3

Ada daftar putar Youtube (di saluran DeepMind ) yang judulnya adalah Pengantar pembelajaran penguatan , yang merupakan kursus (dari 10 pelajaran) tentang pembelajaran penguatan oleh David Silver .

Seseorang yang mengikuti dan menyelesaikan kursus menulis (sebagai komentar Youtube):

Tentu saja sangat baik. Dipacu dengan baik, cukup banyak contoh untuk memberikan intuisi yang baik, dan diajarkan oleh seseorang yang memimpin bidang dalam menerapkan RL ke game.


3

Sebelum itu tanyakan pada diri Anda apakah Anda benar-benar ingin belajar tentang "belajar penguatan." Meskipun ada banyak hype tentang pembelajaran penguatan, penerapan pembelajaran penguatan dunia nyata hampir tidak ada. Sebagian besar kursus online mengajarkan Anda sedikit tentang pembelajaran mesin, jadi jauh lebih baik untuk menyelesaikannya, daripada melanjutkan ke pembelajaran penguatan. Belajar penguatan belajar agak berbeda dari belajar tentang teknik belajar tanpa pengawasan / diawasi.

Karena itu, cara tercepat untuk mendapatkan pemahaman yang baik tentang pembelajaran penguatan adalah sebagai berikut:

  1. Baca posting blog Andrej Karpathy "Pong from Pixels."

  2. Tonton kuliah Deep RL Bootcamp .

  3. Untuk memahami matematika di balik teknik-teknik ini, lihat Sutton and Barto Reinforcement Learning: An Introduction .

  4. Baca makalah yang relevan (bermain game dll.).

PS: Pastikan bahwa Anda teliti dengan dasar-dasar jaringan saraf, karena sebagian besar makalah saat ini di RL melibatkan penggunaan DNN dalam beberapa atau dengan cara lain sebagai aproksimasi.


real-world applicability of reinforcement learning is almost non-existent AlphaGo dilatih dengan pembelajaran penguatan.
cantordust

Terima kasih, apa yang saya sukai dari pembelajaran penguatan adalah ia dapat meningkatkan dirinya sendiri hanya dengan melakukan tugas itu berulang-ulang. Tidak diperlukan pengawasan. Hanya model yang harus menjelaskan masalahnya dengan benar.
Martin S


@thecomplexitytheorist Ya, saya mengetahui posting itu, dan ya, ada kesulitan yang terkait dengan RL (seperti metode ML lainnya). Namun, kesulitan-kesulitan ini tidak menyiratkan bahwa penerapannya tidak ada. Contoh sukses lain (juga disebutkan dalam posting) adalah peningkatan efisiensi pendinginan pusat data Google sebesar 40% - hampir tidak signifikan.
cantordust

1
@Cantordust, Anda harus membaca posting itu sepenuhnya, tidak ada "pembelajaran penguatan" pembelajaran yang terlibat dalam "meningkatkan efisiensi pendinginan", mereka telah dengan jelas menyebutkan bahwa mereka membuat prediksi berdasarkan data konsumsi daya masa lalu.
riemann77


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.