MCTS / UCT adalah metode pencarian tree game yang menggunakan algoritma bandit untuk memilih node yang menjanjikan untuk dijelajahi. Permainan dimainkan sampai selesai secara acak dan simpul yang mengarah ke lebih banyak kemenangan dieksplorasi lebih berat. Algoritme bandit menjaga keseimbangan antara penjelajahan simpul dengan tingkat kemenangan tinggi dan penjelajahan simpul yang tidak diketahui (dan dalam bentuk murni tidak perlu menggunakan fungsi evaluasi heuristik). Program-program yang didasarkan pada teknik umum ini telah mencapai hasil yang cukup luar biasa di komputer Go .
Apakah pencarian monte-carlo yang digerakkan oleh bandit telah diterapkan pada masalah pencarian lainnya? Misalnya, apakah itu akan menjadi pendekatan yang berguna dalam mendekati solusi untuk MAX-SAT, BKP, atau masalah optimasi kombinatorial lainnya? Adakah karakteristik masalah tertentu (struktural / statistik / dll.) Yang akan menyarankan apakah pendekatan gaya bandit akan efektif atau tidak?
Adakah masalah deterministik yang diketahui yang akan benar-benar tahan terhadap metode bandit, karena sifat ruang solusi?