Saya ingin menggambarkan contoh pemodelan yang berkaitan dengan tingkat kanker (Seperti dalam Johnson dan Albert 1999). Ini akan menyentuh elemen pertama dan ketiga dari minat Anda.
Jadi masalahnya adalah memprediksi tingkat kanker di berbagai kota. Katakanlah kita memiliki data jumlah orang di berbagai kota dan jumlah orang yang meninggal karena kanker . Katakanlah kita ingin memperkirakan tingkat kanker . Ada berbagai cara untuk memodelkan mereka dan ketika kita melihat masalah dengan masing-masing. Kita akan melihat bagaimana pemodelan heirachical bayes dapat mengatasi beberapa masalah.
1. Salah satu caranya adalah dengan melakukan estimasi secara terpisah tetapi kita akan menderita masalah data yang jarang dan akan meremehkan tarif sebagaimana rendah .Nixiθi
Ni
2. Satu lagi pendekatan untuk mengelola masalah data jarang adalah menggunakan sama untuk semua kota dan mengikat parameter tetapi ini juga merupakan asumsi yang sangat kuat.
3. Jadi yang bisa dilakukan adalah semua mirip dalam beberapa hal tetapi juga dengan variasi spesifik kota. Jadi kita bisa memodelkan sedemikian rupa sehingga semua diambil dari distribusi umum. Katakanlah dan
Distribusi gabungan penuh akan menjadi mana . Kita perlu menyimpulkanθi
θiθixi∼Bin(Ni,θi)θi∼Beta(a,b)
η = ( a , b ) η θ i η θ ip(D,θ,η|N)=p(η)∏Ni=1Bin(xi|Ni,θi)Beta(θi|η)η=(a,b)ηdari data. Jika dijepit ke konstanta maka informasi tidak akan mengalir antara dan mereka akan independen secara kondisional. Tetapi dengan memperlakukan sebagai tidak diketahui, kami mengizinkan kota-kota dengan data yang lebih sedikit meminjam kekuatan statistik dari kota-kota dengan lebih banyak data.
Gagasan utamanya adalah untuk lebih bayesian dan menetapkan prior pada prior untuk memodelkan ketidakpastian dalam hiperparameter. Ini memungkinkan aliran pengaruh antara dalam contoh ini.θiη
θi