Contoh run ditambahkan 4/11
Klarifikasi Aturan 4/8: Semua pengiriman akan bersaing dalam satu turnamen gratis untuk semua raksasa yang terdiri dari sebanyak pertandingan yang dapat dilakukan oleh komputer saya dalam 48 jam.
Siapa pun yang menghabiskan waktu menonton streaming di Twitch menyadari prevalensi DeepBot , dan mungkin bahkan akrab dengan permainan taruhan Bank Heist- nya. Turnamen King of the Hill ini langsung terinspirasi oleh game itu. Tapi jangan khawatir. Saya pikir saya telah melemparkan cukup ketegaran ekstra ke versi ini untuk menjaga hal-hal menarik.
Contoh cepat
#####GAME 13: 16 players######
Round 1:
gunHeCK bet 0.
PassivePanga bet 69.
SnitcherKing bet 1.
Lurker bet 0.
OC'sRandomTpyos bet 1.
MonisAddiction bet 69.
RaysFive01K bet 28.
LimeadeSneaktar bet 1.
KaylorrCriterion bet 0.
HardHatUmar bet 0.
HeCKuSumer bet 185.
Round 2
HeCKuSumer decided to !guncheck.
LimeadeSneaktar decided to double cross.
MonisAddiction decided to all in.
OC'sRandomTpyos decided to acquire intel.
RaysFive01K decided to deposit.
SnitcherKing decided to finger.
PassivePanga decided to !guncheck.
Results
PassivePanga failed. :(
SnitcherKing failed. :(
OC'sRandomTpyos was successful, and may gain ¥0
MonisAddiction failed. :(
RaysFive01K was successful, and may gain ¥0
LimeadeSneaktar was successful, and may gain ¥1
HeCKuSumer failed. :(
Results:
0. KaylorrCriterion: 3600
1. Lurker: 3600
2. gunHeCK: 3600
3. SnitcherKing: 3586
4. PassivePanga: 2634
5. LimeadeSneaktar: 2496
6. HeCKuSumer: 1909
7. HardHatUmar: 490
8. RaysFive01K: 255
9. OC'sRandomTpyos: 170
10. MonisAddiction: 0
(In this round, 7 players joined the heist, but the dice only rolled right for 3 of them. Of those, only LimeadeSneaktar brought any home--having stolen it from OcsRandomTpyos. RaysFive01K won significantly more, but deposited it all at the bank before leaving. At this point, the players who did not heist are doing well, living off their day jobs.)
#####GAME 14: 231 players######
Round 1:
Lurker bet 0.
HeCKuSumer bet 190.
KaylorrCriterion bet 0.
HardHatUmar bet 0.
MonisAddiction bet 0.
OC'sRandomTpyos bet 1.
gunHeCK bet 0.
LimeadeSneaktar bet 1.
RaysFive01K bet 25.
PassivePanga bet 69.
SnitcherKing bet 1.
Round 2
PassivePanga decided to !guncheck.
OC'sRandomTpyos decided to buy guard.
HeCKuSumer decided to !guncheck.
SnitcherKing decided to finger.
RaysFive01K decided to deposit.
LimeadeSneaktar decided to double cross.
Results
HeCKuSumer failed. :(
OC'sRandomTpyos failed. :(
LimeadeSneaktar failed. :(
RaysFive01K failed. :(
PassivePanga failed. :(
SnitcherKing failed. :(
Results:
0. KaylorrCriterion: 3840
1. Lurker: 3840
2. gunHeCK: 3840
3. SnitcherKing: 3825
4. PassivePanga: 2805
5. LimeadeSneaktar: 2495
6. HeCKuSumer: 1959
7. HardHatUmar: 490
8. MonisAddiction: 240
9. RaysFive01K: 229
10. OC'sRandomTpyos: 161
Six players heisted--but should have been paying more attention to the rabble and backed out, because the probabilities dropped too low to win, and all failed.
#####GAME 15: 300 players######
Round 1:
OC'sRandomTpyos bet 1.
Lurker bet 0.
SnitcherKing bet 1.
MonisAddiction bet 69.
LimeadeSneaktar bet 1.
gunHeCK bet 0.
HardHatUmar bet 0.
RaysFive01K bet 22.
KaylorrCriterion bet 0.
HeCKuSumer bet 195.
PassivePanga bet 69.
Round 2
HeCKuSumer decided to !guncheck.
OC'sRandomTpyos decided to buy guard.
MonisAddiction decided to all in.
PassivePanga decided to !guncheck.
LimeadeSneaktar decided to double cross.
RaysFive01K decided to deposit.
SnitcherKing decided to finger.
Results
OC'sRandomTpyos failed. :(
SnitcherKing failed. :(
MonisAddiction was successful, and may gain ¥0
LimeadeSneaktar failed. :(
RaysFive01K failed. :(
HeCKuSumer failed. :(
PassivePanga failed. :(
And here, the probabilities dropped too low to win again--except for MonisAddiction, who went all in, and therefore avoided the probability modification incurred by the rabble backing out. No winnings are listed here, because a player who wins going all in immediately adds all winnings to its holdings without any possible modification by other players' actions.
Aturan Game
Struktur Turnamen / Game
- Turnamen ini akan terdiri dari sejumlah game yang dipilih secara seragam secara acak antara 1000 dan 1100, di mana setiap pengiriman serius akan bersaing secara bersamaan dalam gratis-untuk-semua.
- Setiap pemain memulai gim pertama dengan 240 kredit dan setiap gim berikutnya dengan jumlah kredit pada akhir gim sebelumnya.
- Setiap pertandingan berlangsung dalam 2 putaran, dan dalam setiap putaran, pemain dipanggil dalam urutan yang ditentukan secara seragam secara acak untuk membuat satu keputusan:
- Di babak pertama, seorang pemain dapat membayar jumlah bilangan bulat kredit antara 0 dan kepemilikan kredit saat ini untuk partisipasi saham dalam pencurian bank.
- Di babak kedua, setiap pemain yang terpilih untuk berpartisipasi dalam pencurian dengan bertaruh setidaknya satu kredit (selanjutnya disebut "heister") dapat memutuskan untuk membiarkan taruhannya naik (dan, saat melakukannya, mungkin melakukan beberapa tindakan lain), menyisih dari pencurian, atau pergi all-in. (Opsi ini dijelaskan lebih lanjut di bawah ini.)
- Berdasarkan jumlah heister dan jumlah kredit yang mereka bayar, satu dari lima bank dipilih untuk melakukan pencurian. Pilihan ini memengaruhi probabilitas kemenangan individu dan kemungkinan penentuan pembayaran. (Bank-bank dijelaskan di bawah ini.)
- Setiap heister yang tidak memilih keluar akan, dengan probabilitas bank (dimodifikasi), memenangkan taruhannya dikalikan dengan peluang taruhan bank (dimodifikasi) (dibulatkan ke bawah), atau kehilangan taruhannya. Perhatikan bahwa keberhasilan atau kegagalan setiap pemain ditentukan secara individual - beberapa akan berhasil ketika yang lain gagal.
- Semua pemain, apakah mereka berpartisipasi atau tidak, berhasil atau gagal, kemudian menerima gaji (dengan pengecualian yang diuraikan di bawah).
- Perhatikan bahwa tidak mungkin meninggalkan game secara permanen. Paling buruk, seorang pemain mungkin harus menunggu permainan untuk menerima gaji berikutnya.
- Setelah semua 1000-1100 pertandingan, pemain dengan jumlah kredit terbesar akan dinyatakan sebagai pemenang turnamen itu.
- Turnamen akan diulang beberapa kali tidak ditentukan (sebanyak yang dapat dihitung dalam 48 jam) dan penghasilan pemain di semua turnamen dijumlahkan untuk menentukan pemenang keseluruhan dari kontes ini.
Babak Taruhan Kedua
- Setiap pemain yang bertaruh positif pada putaran pertama dapat ikut serta dalam putaran kedua.
- Di babak ini, pemain dapat:
- balas dengan string "mundur" untuk membatalkan taruhannya. Ini akan menetapkan taruhannya ke nol untuk pencurian saat ini dan juga sedikit mengurangi kemungkinan para pemain yang tersisa dalam pencurian akan berhasil. Dengan mengambil opsi ini, seorang pemain lupa pembayaran gaji 240 kredit yang mengikuti pencurian sebagai hukuman karena menempatkan para menteri yang tersisa dalam bahaya. (Sisa-sisa heisters akan berhasil dengan probabilitas sama dengan probabilitas bank dikalikan dengan fraksi heisters yang tidak "mundur".)
- balas dengan string "serba ada" untuk meledakkan seluruh kepemilikan kreditnya - dan mengambil pinjaman gaji pada 240 cek kredit berikutnya - untuk membeli semua peralatan dan intel terbaik untuk pencurian dan masuk sendiri, meriam, tanpa senjata mengandalkan siapa pun. Probabilitas kemenangan pemain seperti itu tidak dapat dipengaruhi oleh heister lain yang keluar dari pencurian, juga kemenangannya tidak dapat dicuri oleh crosser ganda. Pembayaran yang menang akan ditentukan seolah-olah taruhannya adalah seluruh kepemilikan kredit ditambah 240, sementara kerugian akan mengatur kepemilikannya menjadi nol.
- Balas dengan string lain (termasuk string kosong) untuk tetap dengan taruhan sebelumnya dan melanjutkan dengan pencurian seperti biasa. (Jawaban yang disarankan: "! Guncheck"). Balasan tertentu akan memiliki efek samping tambahan:
- Balasan "ganti pekerjaan" akan menyebabkan pemain berhenti dari pekerjaannya. Mulai babak ini, pada akhir setiap putaran, pemain akan memiliki peluang 5% untuk dipekerjakan di posisi baru. Jika ini berhasil, pemain tersebut disewa dan segera menerima gaji pertamanya. Setiap pekerjaan baru dijamin untuk membayar tepat 5% lebih dari yang terakhir (dibulatkan ke bawah). Tindakan ini akan berhasil apakah pencurian berhasil atau tidak.
- Balasan "memperoleh intel" akan, jika pencurian berhasil, menyebabkan pemain menghabiskan semua kemenangannya dari pencurian itu untuk mendapatkan 0,00001 ekstra per kredit sehingga dihabiskan untuk peluang bank yang hanya mendapatkan pemain itu saja . Modifikasi peluang ini bersifat permanen. Sebagai contoh, jika seorang pemain memilih tindakan ini ketika mengambil bank 1 dan memenangkan 6969 kredit dalam pencurian, peluang bank 1 untuk pemain itu akan meningkat secara permanen sebesar 0,06969 dan pemain tidak akan menerima apa pun dari pencurian itu.
- Balasan "penjaga pembelian" akan menyebabkan pemain membeli salah satu penjaga keamanan di bank yang sedang diajak. Sebagai imbalan untuk pengurangan permanen 1 kredit pada gaji pemain itu (suap reguler penjaga), pemain akan menerima "peningkatan" kemungkinan kemenangan yang meningkat secara permanen di bank itu (karena penjaga "lupa menyebutkan" pemain itu kepada polisi ketika tanya). Probabilitas akan meningkat tepat 1% dari perbedaan antara probabilitas kemenangan pemain saat ini di bank itu dan 100%. Tindakan ini akan berhasil bahkan jika pencurian gagal. CATATAN: Jika suatu saat, seorang pemain tidak memiliki kredit yang cukup untuk membayar semua suap penjaga, segera dan "secara permanen" kehilangan bonus probabilitas sebanyak jumlah suap yang tidak dapat dibayar,
- Balasan "setoran" akan, jika pencurian berhasil, meninggalkan seluruh kemenangan pemain dalam akun di bank heisted. Kredit tidak akan dapat diakses untuk tujuan apa pun atau diperhitungkan terhadap skor pemain sampai ditarik. Akun ini akan membayar bunga pada tingkat 0,14% per game.
- Balasan "penarikan" akan, jika pencurian berhasil, menambah kemenangan pemain seluruh isi akunnya di bank heisted. Akun akan menjadi nol sebagai hasilnya. Perhatikan bahwa kemenangan tambahan ini dapat dicuri oleh penyilang ganda.
- Balasan "silang ganda" akan melakukan satu dari dua hal:
- Jika jumlah heister yang memainkan "double cross" paling banyak 1/10 (dibulatkan ke bawah) dari jumlah total heister non-rakyat jelata yang memutuskan untuk melanjutkan dengan pencurian (atau tepatnya satu jika ada kurang dari 10 pemain seperti itu) ), pemain akan menerima kemenangan tambahan sama dengan total kemenangan semua non-lintas ganda dibagi dengan jumlah lintas ganda (dibulatkan ke bawah). Semua non-double-crosser dalam hal ini menerima 0 kredit dari pencurian. Dengan kata lain, pelintas ganda mencuri kredit orang lain dan membaginya secara merata di antara mereka sendiri.
- Jika jumlah heister yang memainkan "double cross" melebihi ambang batas, pemain tidak akan menerima kemenangan (jika pencuriannya berhasil), potong gajinya menjadi dua, dan dipecat dari pekerjaannya. (Lihat "ganti pekerjaan".) Semua yang bukan pelintas ganda (termasuk rakyat jelata) dalam hal ini akan menerima pembayaran bonus dari total kemenangan semua pelintas ganda dibagi dengan jumlah total pelintas bukan-ganda. Dengan kata lain, konspirasi menjadi terlalu besar untuk dirahasiakan, para konspirator dicabut dan dikeluarkan dari pencurian, dan semua orang membagi taruhannya untuk hukuman - dan reputasi mereka untuk urusan kotor kehilangan pekerjaan mereka juga.
- Sebuah jawaban dari "jari" (seperti dalam "meraba tikus bajingan lintas ganda") akan, jika pencurian berhasil, memberikan pemain delapan peluang (menggambar secara seragam dengan penggantian dari set non-rakyat jelata heisters) untuk mengidentifikasi dua crosser yang belum diidentifikasi .
- Setiap double-crosser yang diidentifikasi dengan cara ini akan segera membayar jari 25% dari kepemilikan kredit saat ini (dibulatkan) sebagai pengganti ditembak, kehilangan pekerjaannya dan memotong gajinya menjadi dua (karena bos tidak akan mentolerir perilaku buruk) , dan kehilangan 5% dari kemungkinan kemenangannya di bank yang sedang diajak (karena para pengembara lainnya sangat curiga di masa depan dan cenderung membuangnya di bawah bus jika keadaan menjadi lebih buruk). Double-crosser yang diidentifikasi dengan cara ini tidak memengaruhi apakah double-cross berhasil untuk double-crosser lainnya, tetapi mereka tidak menerima kredit yang dicuri dari double-cross, dan mengatakan kredit curian akan didistribusikan kembali ke non-cross-cross. lintas ganda.
- Jika tidak ada pelintas ganda yang diidentifikasi dengan cara ini, snitch akan mendapatkan jahitan karena membuang waktu semua orang - dan juga membayar setengah kemenangannya dari pencurian saat ini, ambil potongan 5% pada gajinya (bos memotong jam tattletale), dan kehilangan 5% dari peluang taruhannya di bank saat ini (karena para heister lainnya kecil kemungkinannya untuk bermurah hati / adil dengan kemenangan mereka di masa depan). Setengah dari kemenangannya yang hilang akan didistribusikan kepada pelintas-ganda yang tidak terikat jika pelari-ganda berhasil, atau pelintas-non-ganda (termasuk rakyat jelata) jika pelintas-ganda gagal.
Bank
Bank dipilih menggunakan indeks numheisters + int(totalamountbet/100000)
, di mana angka adalah jumlah pemain yang bertaruh dengan taruhan positif di babak 1 dan totalamountbet adalah jumlah taruhan dari semua pemain tersebut. Dengan kata lain, seratus ribu kredit sama bagusnya dengan 1 heister tambahan. Berdasarkan indeks ini, salah satu bank berikut akan dipilih, bank dengan ambang tertinggi yang dipenuhi atau dilampaui indeks:
Bank Index Threshold Victory Prob. Bet Odds
---- --------------- ------------- --------
0:Municipal 0 0.540 0.80
1:City 20 0.488 1.10
2:State 40 0.425 1.30
3:National 60 0.387 1.65
4:Federal Reserve 80 0.324 1.95
Perhatikan bahwa saat turnamen berlanjut, kemungkinan mencapai level bank tertinggi akan meningkat, karena jumlah setiap pemain dapat mempertaruhkan tren ke atas. Perhatikan juga bahwa ini hanya peluang dan probabilitas awal , sebelum dimodifikasi oleh tindakan "mendapatkan intel" atau "beli penjaga". Dengan probabilitas dan peluang awal, hanya City dan National bank yang mengharapkan kemenangan melebihi kerugian yang diharapkan.
Kericuhan
- Turnamen ini juga berisi 500 pemain lain, yang disebut "rakyat jelata", yang berpartisipasi sebagai pemain biasa dalam perampokan tetapi pada akhirnya tidak mendapat skor. Ini berfungsi untuk membuat setiap permainan berbeda dan agak kurang dapat diprediksi, dan memungkinkan untuk mencapai bank yang berisiko / lebih menguntungkan bahkan dengan hanya beberapa pemain "nyata".
- Setiap permainan akan menyertakan beberapa himpunan bagian dari rakyat jelata untuk berpartisipasi dipilih secara seragam secara acak di semua bagian dari rakyat jelata.
- Semua rakyat jelata menggunakan strategi berikut:
- Secara acak memilih untuk bertaruh dengan probabilitas sama dengan probabilitas berhasil di bank yang akan dipilih berdasarkan keputusan para pemain yang telah membuat keputusan pada putaran ini .
- Jika bertaruh dalam jumlah yang tidak nol, pilih yang terbesar dari jumlah berikut yang tidak akan melebihi kepemilikannya saat ini: 69, 420, 6969, 80085.
- Di babak kedua, "mundur" dengan probabilitas sama dengan 5% ditambah 50% dari proporsi petaruh yang sudah mundur, jika tidak pencurian seperti biasa. (Perhatikan bahwa ini berarti pemain awal di babak kedua yang mundur dapat memiliki efek cascading besar di antara rakyat jelata - perhatikan dan bersiaplah untuk pencurian runtuh sebelum bahkan dimulai.)
Masukan dan keluaran
Dalam kedua putaran, program akan diberikan informasi berikut, dalam urutan yang tepat ini, sebagai argumen baris perintah . Kecuali dinyatakan sebaliknya, semua nilai adalah bilangan bulat yang tidak mengandung desimal.
- Nomor gim saat ini (diindeks nol)
- Jumlah putaran dari game saat ini (1 atau 2)
- Jumlah pemain dalam game saat ini (termasuk rakyat jelata).
- Jumlah pemain yang telah bergantian putaran ini.
- Jumlah penyembuh yang telah melakukan taruhan positif sejauh ini. (Di babak kedua, ini benar-benar akan menjadi jumlah total heisters yang membeli di babak pertama.)
- Jumlah total kredit yang diinvestasikan sejauh ini. (Di babak kedua, ini sebenarnya akan menjadi jumlah total kredit yang diinvestasikan di babak pertama - khususnya, itu tidak termasuk lebih dari taruhan awal "semua dalam" heisters dan tidak termasuk taruhannya "mundur" heisters.)
- Jumlah penyembuh yang telah dikonfirmasi di babak kedua (yaitu tidak "mundur"). Ini akan menjadi nol selama putaran pertama.
- Jumlah (nol-indeks) dari bank yang akan dicuri (selama putaran pertama, bank yang akan dicuri jika tidak ada orang lain bertaruh)
- Jumlah kredit saat ini tersedia untuk pemain.
- Jumlah kredit taruhan pemain di babak pertama. (Ini selalu nol di babak pertama.)
- Jumlah kredit yang akan diterima pemain dalam gajinya di akhir setiap pertandingan.
- 1 jika pemain saat ini menerima gaji, 0 jika pemain menganggur
- Peringkat pemain di papan peringkat (tidak termasuk rakyat jelata) pada akhir pertandingan sebelumnya, diindeks 1. (Didefinisikan sebagai 1 + jumlah pemain dengan kredit yang lebih banyak pada waktu itu. Misalnya selama pertandingan pertama, semua pemain memiliki peringkat 1.)
- Jumlah rata-rata kredit yang dipegang oleh semua pemain (tidak termasuk rakyat jelata) (direpresentasikan sebagai angka desimal)
- Penyimpangan absolut rata-rata dalam jumlah kredit yang dimiliki oleh semua pemain (tidak termasuk rakyat jelata) (diwakili sebagai angka desimal)
- Jumlah maksimum kredit yang dimiliki oleh pemain mana pun (yaitu jumlah kredit yang dimiliki oleh pemain peringkat 1, tidak termasuk rakyat jelata)
- Jumlah kredit yang disimpan pemain di rekening bank 0
- Rekening bank 1
- Rekening bank 2
- Rekening bank 3
- Rekening bank 4
- Peluang kemenangan individu pemain di bank 0
- Probabilitas bank 1
- Probabilitas bank 2
- Probabilitas 3 Bank
- Probabilitas Bank 4
- Peluang pembayaran individu pemain pada pencurian yang sukses di bank 0
- Peluang bank 1
- Peluang bank 2
- Peluang bank 3
- Peluang bank 4
Di babak pertama permainan, program pemain harus mencetak untuk menentukan bilangan bulat antara 0 dan jumlah total kredit di akun pemain itu. Setiap jumlah taruhan lebih besar dari saldo kredit yang tersedia dianggap sebagai taruhan maksimal. Output lain (atau kondisi kesalahan) akan ditafsirkan sebagai taruhan nol.
Di babak kedua permainan, program pemain harus mencetak untuk menghentikan string seperti yang dijelaskan di bagian "Putaran Taruhan Kedua" di atas. Kondisi kesalahan di sini dianggap sebagai tindakan default: lanjutkan dengan pencurian seperti biasa.
Pengendali
Turnamen akan dijalankan menggunakan pengontrol ini . Contoh bot di sana juga. Masih diuji. Lebih banyak kode yang akan datang. Jangan ragu untuk mengirimkan perbaikan bug (di github). Akan diperbarui jika ada aturan yang berubah juga.
Untuk menjalankan satu turnamen di mesin Anda sendiri, tambahkan baris ke pesaing.txt dan kemudian gunakan:
python bankheist.py 1000
Peraturan Kontes
- Pemain dapat mengirimkan sejumlah program pemain dalam bahasa apa pun yang tersedia secara bebas yang programnya dapat menerima argumen baris perintah.
- Kiriman harus menyertakan instruksi yang cukup eksplisit untuk cara mengkompilasi program dan menjalankannya di PC saya, termasuk nama-nama alat yang diperlukan dan perintah yang tepat untuk dikeluarkan. Pengajuan harus menyertakan setidaknya satu perintah yang menjalankan program dan mungkin argumen baris perintah ditambahkan langsung ke sana.
- Kiriman juga harus memiliki nama unik untuk mengidentifikasinya (yang tidak mengandung spasi).
- Program harus berjalan dalam waktu yang cukup singkat. (Saya tidak menetapkan batas atas pada apa yang dianggap masuk akal. Sebaliknya, saya hanya akan menyarankan pencipta entri apa pun yang tampaknya memiliki waktu eksekusi yang sangat besar untuk mempercepatnya.)
- Program mungkin tidak membaca atau menulis ke file. Mereka juga tidak dapat menggunakan metode lain untuk menyimpan informasi di antara proses. Inti dari tantangan ini adalah untuk membuat keputusan yang kompleks berdasarkan informasi yang terbatas / diringkas.
- Setiap dan semua aturan ini dapat berubah sewaktu-waktu jika perlu. Sebuah pesan akan ditambahkan di bagian atas posting ini yang mengindikasikan perubahan tersebut.
- Kontes ini berakhir tidak lebih dari satu minggu setelah pengguna terakhir mengirimkan kiriman untuk kiriman pertamanya . Modifikasi dari kiriman yang ada diizinkan setiap saat hingga kontes berakhir. Saya akan melakukan yang terbaik untuk menjaga tenggat waktu saat ini diperbarui dalam pesan di bagian atas posting ini.
- Kontes ini berakhir tidak lebih dari satu minggu setelah peraturan terakhir kali diubah, jika ada. Saya akan melakukan yang terbaik untuk meninggalkan komentar untuk setiap pengguna yang terpengaruh oleh perubahan aturan.
- Anda lebih baik bertaruh saya akan berpartisipasi dalam kontes ini sendiri. ;)