Bayangkan pengaturan berikut: Anda memiliki 2 koin, koin A yang dijamin adil, dan koin B yang mungkin atau mungkin tidak adil. Anda diminta untuk melakukan 100 koin terbalik, dan tujuan Anda adalah memaksimalkan jumlah kepala .
Informasi Anda sebelumnya tentang koin B adalah bahwa koin itu dibalik 3 kali dan menghasilkan 1 kepala. Jika aturan keputusan Anda hanya didasarkan pada membandingkan probabilitas yang diharapkan dari kepala 2 koin, Anda akan membalik koin A 100 kali dan selesai dengan itu. Ini benar bahkan ketika menggunakan estimasi Bayesian yang masuk akal (sarana posterior) dari probabilitas, karena Anda tidak memiliki alasan untuk percaya bahwa koin B menghasilkan lebih banyak kepala.
Namun, bagaimana jika koin B sebenarnya bias mendukung kepala? Tentunya "calon kepala" yang Anda berikan dengan membalik koin B beberapa kali (dan karena itu mendapatkan informasi tentang sifat statistiknya) akan bernilai dalam beberapa hal dan karenanya akan menjadi faktor dalam keputusan Anda. Bagaimana "nilai informasi" ini dijelaskan secara matematis?
Pertanyaan: Bagaimana Anda membuat aturan keputusan yang optimal secara matematis dalam skenario ini?