Osborne, Nash equilibria, dan kebenaran keyakinan

12

Dalam Teori Pengantar Game Osborne, keseimbangan Nash dijelaskan sebagai berikut (hlm. 21-22):

Pertama, setiap pemain memilih tindakannya sesuai dengan model pilihan rasional, mengingat keyakinannya tentang tindakan pemain lain. Kedua, keyakinan setiap pemain tentang tindakan pemain lain benar.

Tampak bagi saya bahwa definisi ini tidak sepenuhnya setara dengan definisi biasa dari kesetimbangan Nash sebagai profil strategi di mana strategi masing-masing pemain adalah respons terbaik terhadap strategi yang lain.

Definisi yang biasa tidak mengatakan apa pun tentang kepercayaan dan karenanya memungkinkan kemungkinan bahwa keyakinan itu mungkin salah.

Untuk mengambil kemungkinan sepele, pertimbangkan Dilema Tahanan. Misalkan setiap pemain percaya bahwa pemain lain tidak akan mengaku. Karena pengakuan adalah strategi dominan, setiap pemain akan tetap mengaku. Jadi tindakan merupakan keseimbangan Nash meskipun kepercayaan para pemain benar-benar kebalikan dari tindakan keseimbangan yang sebenarnya.

Apakah saya benar dalam pemahaman ini bahwa definisi Osborne mencirikan sesuatu selain dari keseimbangan Nash?

game-theory

— Jyotirmoy Bhattacharya
sumber

Tidak "Definisi yang biasa tidak mengatakan apa-apa tentang kepercayaan dan oleh karena itu memungkinkan kemungkinan bahwa kepercayaan itu mungkin salah." Cukup bergantung pada fakta bahwa Anda selalu memiliki asumsi rasionalitas yang mendasari definisi ini?

— Thorst

9

Memperkenalkan bahasa kepercayaan di sini sedikit aneh, mengingat keyakinan memang memiliki makna yang sangat spesifik di bagian lain dari teori permainan.

Memang, deskripsi Osborne mengingatkan kita pada Bayes Nash Equilibrium. Kita bisa memperkenalkan gagasan keyakinan ke dalam bentuk normal dari sebuah permainan informasi yang lengkap sebagai berikut: misalkan dengan probabilitas masing-masing pemain, , adalah "strategis" tipe yang akan bermain sesuai dengan (Nash) keseimbangan, dan dengan probabilitas dia akan memilih beberapa strategi seragam secara acak (karena, katakanlah, ia acuh tak acuh di semua tindakan). Dengan demikian, kami memiliki permainan Bayesian di mana berpikir tentang kepercayaan lebih alami. $a_i$ $i$ $1-a_i$

Konsep solusi Bayes Nash kemudian mengatakan bahwa 's strategi harus optimal mengingat bermain diharapkan diinduksi oleh pemain lain' strategi dan keyakinan atas jenis mereka tersirat oleh . Jika kita melihat batas sebagai untuk semua maka Bayes Nash equilibrium game ini akan bertepatan dengan konsep solusi yang dijelaskan oleh Osborne. $i$ $\{a_j\}_{j\neq i}$ $a_i\rightarrow 1$ $i$

Saya kira alasan Osborne menulisnya seperti ini adalah pedagogis, mengingat bahwa ini adalah teks pengantar. Ketika kami memperkenalkan siswa untuk permainan statis, kita memberitahu mereka pemain yang respon terbaik terhadap tindakan pemain lain. Siswa secara alami ingin tahu "bagaimana mereka dapat menanggapi strategi yang dipilih secara bersamaan tanpa mengetahui apa strategi itu nantinya?" Dalam banyak hal, ini adalah pertanyaan filosofis. Jawaban umum adalah $i$

Jika permainan itu adalah salah satu yang sering dimainkan maka (mengesampingkan masalah hasil lain yang dapat dipertahankan dalam permainan yang berulang) kita dapat menganggap Nash sebagai keseimbangan dalam arti bahwa jika kita bertemu di sana kita dapat mengembangkan norma di mana orang melanjutkan untuk memainkan keseimbangan itu tanpa batas (dan mengharapkan orang lain melakukan hal yang sama).
Jika permainan benar-benar satu-shot maka kita biasanya memunculkan ide bahwa pemain akan mencoba untuk memprediksi apa yang akan dilakukan orang lain — dan gagasan keseimbangan kita menanamkan gagasan bahwa prediksi ini harus benar.

Tampaknya prediksi pada poin kedua sesuai dengan "kepercayaan" yang diajukan oleh Osborne. Namun, penting untuk ditekankan bahwa prediksi / "kepercayaan" ini, hanyalah alat informal / intuitif untuk membantu kita membuat konsep apa yang sedang terjadi dalam keseimbangan dan bukan bagian dari definisi keseimbangan semacam itu. Konsep kesetimbangan Nash itu sendiri sepenuhnya agnostik pada gagasan kepercayaan (seperti yang Anda catat dalam komentar, itu hanya didefinisikan atas tindakan), itulah sebabnya, ketika Osborne melanjutkan untuk secara resmi mendefinisikan ekuilibrium Nash, ia melakukannya tanpa menggunakan ide keyakinan sama sekali.

— Di mana-mana
sumber

4

Memperkenalkan keyakinan membuat konsep NE sebanding dengan konsep penyempurnaan lainnya seperti PBE dan keseimbangan berurutan, tetapi arti NE tidak berubah.

Buku teks mikro lulusan oleh Mas-Colell, Whinston, dan Green (MWG) memiliki hasil untuk ini

Proposisi 9.C.1. Profil strategi adalah keseimbangan Nash dari permainan bentuk yang luas jika dan hanya jika ada sistem kepercayaan sedemikian rupa sehingga $\sigma$ $\Gamma_E$ $\mu$

Profil strategi secara berurutan rasional diberikan sistem kepercayaan pada semua set informasi sedemikian sehingga . $\sigma$ $\mu$ $H$ $\Pr(H|\sigma)>0$

Sistem kepercayaan diturunkan dari profil strategi melalui aturan Bayes bila memungkinkan. $\mu$ $\sigma$

Jadi, contoh Dilema Tahanan yang Anda berikan di mana pemain memiliki keyakinan yang berlawanan dengan apa strategi aktual lawan gagal pada kondisi kedua, yang mengharuskan kepercayaan diturunkan dari aturan Bayes kapan pun memungkinkan. Sebenarnya, ini adalah persamaan matematis dari persyaratan kedua definisi Osborne: bahwa keyakinan seorang pemain tentang tindakan pemain lain adalah benar.

— Herr K.
sumber

Saya pikir ada perbedaan antara MWG dan Osborne. MWG mengatakan bahwa untuk keseimbangan Nash "ada" sistem kepercayaan yang membuatnya masuk akal. Kami diam pada keyakinan apa, jika ada, yang benar-benar dimiliki oleh pemain. Osborne mengatakan bahwa para pemain benar-benar memiliki kepercayaan dan mereka adalah yang benar. Saya berpikir bahwa yang terakhir mengubah makna konseptual NE karena definisi yang biasa tidak menyebutkan kepercayaan sama sekali dan contoh Dilema Tahanan menunjukkan bahwa strategi tidak secara unik menentukan keyakinan.

— Jyotirmoy Bhattacharya

@JyotirmoyBhattacharya: Saya tidak berpikir MWG "diam pada keyakinan apa, jika ada, yang benar-benar dimiliki para pemain". Kondisi 2 dari proposisi sebenarnya mensyaratkan bahwa kepercayaan ini diturunkan dari profil strategi keseimbangan menggunakan aturan Bayes bila memungkinkan. Jadi, dalam contoh PD, ketika satu pemain memilih cacat dengan probabilitas 1, kepercayaan pemain lain juga harus menempatkan probabilitas 1 pada cacat tindakan dan merespons terbaik dengan keyakinan seperti itu (yang mengarah padanya juga memilih cacat).

— Herr K.

@JyotirmoyBhattacharya: Keyakinan untuk NE tidak harus unik, namun. Ini karena jika untuk keseimbangan tertentu, jalur pada pohon permainan diambil dengan probabilitas nol, maka aturan Bayes tidak berlaku, dan kepercayaan apa pun pada jalur tersebut akan dianggap "benar" dalam NE. Ini juga mengapa penyempurnaan seperti keseimbangan berurutan diperkenalkan, sehingga untuk menyingkirkan keyakinan yang tidak masuk akal dari jalur keseimbangan.

— Herr K.

@JyotirmoyBhattacharya: Juga, karena ini adalah buku teks sarjana, Osborne mungkin telah memilih bahasa yang lebih intuitif daripada matematis yang keras untuk alasan pedagogis. Bagi saya, dua kondisi dalam definisi Osborne adalah mitra yang tepat dalam proposisi MWG.

— Herr K.

3

Contoh dilema tahanan Anda hanya berhasil karena itu adalah permainan dengan strategi dominan. Osborne benar.

Untuk merespons strategi pemain lain dengan sebaik-baiknya, seperti dalam definisi yang Anda berikan, saya harus tahu strategi mereka. Dengan kata lain, saya harus memiliki keyakinan tentang apa yang mereka lakukan, dan keyakinan itu harus benar. Ini adalah penguatan konsep rasionalisasi.

$(\sigma,\mu_1)$ $(\sigma,\mu_2)$ $\mu_2$ $\sigma\in \Sigma$ $\sigma_i\in B_i(\sigma_{-i})$ ... "Saya percaya ini berarti bahwa mendefinisikan kepercayaan itu tidak perlu, karena kepercayaan itu adalah penilaian yang benar dari profil strategi. Merujuk, salah satu buku saya, itu memberikan definisi biasa dengan kutipan Nash (1950), dan kemudian dilanjutkan dengan membahas dua asumsi mendasar: Yang pertama adalah keyakinan yang benar dan yang lain adalah permainan rasional mengingat keyakinan yang benar itu.

— Pburg
sumber

Tetapi untuk menyangkal sesuatu satu contoh balasan sudah cukup. Jika Anda menganggap Osborne sebagai mengklaim bahwa definisinya setara dengan Nash, lalu bagaimana orang tersebut berurusan dengan contoh tandingan Dilema Tahanan. Saya mengerti bahwa definisi Osborne adalah penguatan rasionalisasi, saya sampaikan bahwa itu bukan ekuilibrium Nash karena alasan sederhana bahwa di sini ekuilibrium didefinisikan atas tindakan dan keyakinan sedangkan ekuilibrium Nash sepenuhnya diam mengenai kepercayaan.

— Jyotirmoy Bhattacharya

1

Itu adalah definisi, bukan bukti.

— Pburg

Cukup adil. Tapi itu adalah definisi konsep yang sudah memiliki definisi lain yang diterima dengan baik. Jadi saya berharap bahwa jika penulis tidak menyebutkan sebaliknya, ia mengklaim bahwa kedua definisi itu setara.

— Jyotirmoy Bhattacharya

agar jelas, apakah dia memasukkan komentar-komentar itu dalam definisi, atau dalam diskusi? ps saya mengedit jawaban saya

— Pburg

Bagian yang saya kutip adalah diskusi. Segera setelah itu dia berkata (hal.22) "Dua komponen ini terkandung dalam definisi berikut" dan kemudian memberikan definisi standar dalam hal respons terbaik terhadap strategi yang tidak menyebutkan kepercayaan sama sekali. Jadi di mana kepercayaan yang terkandung dalam definisi tersebut? Dan masalahnya bukan hanya pada game dengan strategi dominan. Sangat mungkin untuk membangun contoh-contoh di mana tidak ada strategi dominan tetapi strategi kesetimbangan Nash adalah respons terbaik terhadap kepercayaan yang berbeda dari permainan keseimbangan.

— Jyotirmoy Bhattacharya

2

Saya mungkin mengulangi hal-hal yang telah dikatakan sebelumnya, tetapi inilah pendapat saya tentang ini.

Saya pikir kita menghadapi masalah yang biasa ketika membandingkan dua model yang berbeda. Apa yang dimaksud dengan "kesetaraan" tidak sepenuhnya jelas karena dua definisi tersebut terletak di dunia yang berbeda, atau model yang berbeda. Namun, jika "kesetaraan" didefinisikan dengan benar, saya pikir orang dapat memahami definisi Osborne dan menunjukkan bahwa itu memang "setara" dengan NE.

Konsep solusi yang mendasari bagian yang dikutip akan menjadi seperti berikut:

$s^*$ $b^*$ $i$

${kamu}_{saya} (s_{saya}^{*} | s_{- saya} = b_{saya}^{*}) \geq {kamu}_{saya} (s^{'} | s_{- saya} = b_{saya}^{*}) untuk semua s^{'} \in S_{saya}$ $u_i ( s^*_i ~|~ s_{-i} = b^*_{i}) \geq u_i ( s' ~|~ s_{-i} = b^*_{i}) \text{ for all } s' \in S_i$ $b_{saya}^{*} = s_{- saya}^{*}$ $b^*_i = s^*_{-i}$

$\Leftrightarrow$

$\Rightarrow$

$p$

$\Rightarrow$

Ini bagian yang sulit. Apa artinya "Setiap NE adalah BE"? Tentu saja tidak bahwa "NE ditambah setiap profil keyakinan adalah BE", sebagai OP menunjukkan dengan kontra-teladannya. Namun, ini adalah kasus bahwa "NE mana pun dapat dijadikan BE untuk beberapa profil kepercayaan ". Saya pikir dalam pengertian inilah seseorang harus memahami klaim "kesetaraan" Osborne

Perhatikan bahwa kami juga memiliki lebih banyak pernyataan "seperti kesetaraan": " Hasil pertandingan adalah hasil NE jika dan hanya jika itu adalah hasil BE".

— Martin Van der Linden
sumber

Tetapi setiap BE bukan NE karena konsep BE adalah melemahnya rasionalisasi yang kami lebih lemah dari NE.

— Jyotirmoy Bhattacharya

Seperti yang saya tulis, saya kesulitan memahami apa artinya menjadi "tidak menjadi" NE karena mereka tampaknya hidup dalam model yang berbeda. Apakah maksud Anda bahwa beberapa strategi yang dimainkan pada BE bukanlah NE? Saya pikir itu tidak benar, tetapi saya mungkin melewatkan sesuatu. Jika itu yang Anda maksud, dapatkah Anda mengarahkan saya ke contoh yang berlawanan? Itu akan sangat membantu.

— Martin Van der Linden

Saya tidak yakin bahwa BE adalah melemahnya rasionalisasi. Dalam pemahaman saya, BE adalah rasionalisasi bersama dengan kondisi bahwa dugaan itu benar, kan? Jika itu benar, maka bukankah kita akan lebih kuat dari rasionalisasi? (tentu saja mungkin tergantung pada apa yang disebut konsep solusi "lebih lemah / kuat")

— Martin Van der Linden