Saya sudah memiliki implementasi berfungsi untuk agen tunggal yang mengerjakan masalah penetapan harga dinamis dengan tujuan memaksimalkan pendapatan. Masalah yang sedang saya tangani, bagaimanapun, melibatkan beberapa produk berbeda yang merupakan pengganti satu sama lain, sehingga penetapan harga mereka secara dinamis dengan pembelajar mandiri tampaknya tidak benar, karena harga satu memengaruhi hadiah yang lain. Tujuannya adalah untuk memberi harga secara dinamis pada mereka semua untuk memaksimalkan jumlah masing-masing pendapatan individu.
Saya telah melakukan beberapa penelitian untuk mencoba menemukan sesuatu yang menerapkan pembelajaran penguatan dengan cara ini, tetapi banyak implementasi multi-agen yang saya temukan lebih fokus pada permainan kompetitif daripada koperasi, atau mereka mengasumsikan pengetahuan yang tidak lengkap dari agen lain (saya ingin menyelesaikan pengetahuan masing-masing agen dalam skenario ini). Apakah ada aplikasi pembelajaran kooperatif yang diteliti dengan baik / didokumentasikan dengan cara ini?