Bandit multi-lengan bekerja dengan baik dalam situasi di mana Anda memiliki pilihan dan Anda tidak yakin mana yang akan memaksimalkan kesejahteraan Anda. Anda dapat menggunakan algoritme untuk beberapa situasi kehidupan nyata. Sebagai contoh, belajar bisa menjadi bidang yang baik:
Jika seorang anak mempelajari pertukangan kayu dan dia buruk dalam hal itu, algoritme akan memberitahunya bahwa dia mungkin harus melanjutkan. Jika dia pandai, algoritma akan memberitahunya untuk terus mempelajari bidang itu.
Berkencan juga merupakan bidang yang baik:
Anda seorang pria yang melakukan banyak 'usaha' dalam mengejar seorang wanita. Namun, usaha Anda pasti tidak disukai. Algoritme harus "sedikit" (atau sangat) mendorong Anda untuk melanjutkan.
Untuk situasi kehidupan nyata orang lain apa kita dapat menggunakan algoritma multi-arm bandit?
PS: Jika pertanyaannya terlalu luas, silakan tinggalkan komentar. Jika ada konsensus, saya akan menghapus pertanyaan saya.