Jawaban yang saya terima untuk pertanyaan tentang pelatihan robot mengikuti garis menggunakan teknik pembelajaran penguatan , membuat saya berpikir tentang cara melatih robot. Saya percaya pada dasarnya ada dua cara -
- Latih robot fisik.
- Memodelkan robot dan mensimulasikan pelatihan.
- Apakah saya melewatkan sesuatu?
Pendekatan 2 jelas merupakan pendekatan yang lebih baik. Namun, pengetahuan apriori tentang gerak (respons), sinyal PWM tertentu (stimulus) akan menyebabkan ketika robot dalam keadaan tertentu diperlukan. Gerakan yang disebabkan oleh sinyal PWM mungkin tergantung pada ( 1 ) tegangan baterai saat ini, ( 2 ) massa robot dan ( 3 ) kecepatan arus (apakah saya melewatkan sesuatu?).
Bagaimana cara saya memodelkan robot seperti itu? Dan bagaimana cara memodelkannya dengan cepat? Jika saya mengganti baterai atau menambahkan beberapa papan dan periferal lain serta mengubah massa robot, saya harus merombak dan melatih ulang robot. Dapatkah saya melakukan ini dengan memberikan beberapa PWM stimulus acak dan mengukur respons?
menambahkan: Pertanyaan terkait saya di dsp.SE
Pembaruan: Suntingan yang disarankan untuk judul oleh Ian layak disebutkan - " Bagaimana cara saya model melatih robot sehingga jika dinamika berubah, itu tidak perlu pelatihan ulang lengkap? " Saya pikir ini adalah pertanyaan yang bagus juga tetapi berbeda dari yang saya tanyakan di sini. Saya baik-baik saja dengan pelatihan ulang untuk saat ini.