Buku Kevin Murphy membahas masalah Hierarchical Bayesian klasik (awalnya dibahas dalam Johnson and Albert, 1999, p24
):
Misalkan kita mencoba memperkirakan tingkat kanker di kota. Di setiap kota, kami mencicipi sejumlah individu dan mengukur jumlah penderita kanker dimana adalah tingkat kanker sejati di kota.
Kami ingin memperkirakan Sementara memungkinkan kota-kota miskin data untuk meminjam kekuatan statistik dari kota-kota kaya data.
Untuk melakukannya, ia menjadi model sehingga semua kota berbagi sebelumnya yang sama, sehingga model akhir terlihat sebagai berikut:
dimana .
Bagian penting tentang model ini tentu saja (saya kutip), "yang kami simpulkan dari data, karena jika kita hanya menjepitnya ke konstanta, the akan mandiri secara kondisional, dan tidak akan ada aliran informasi di antara mereka ".
Saya mencoba model ini di PyMC , tetapi sejauh yang saya mengerti, saya perlu terlebih dahulu dan (Saya percaya ini atas). Apa yang akan menjadi satu hal yang baik sebelum model ini?
Dalam kasus ini membantu, kode, seperti yang saya miliki sekarang adalah:
bins = dict()
ps = dict()
for i in range(N_cities):
ps[i] = pm.Beta("p_{}".format(i), alpha=a, beta=b)
bins[i] = pm.Binomial('bin_{}'.format(i), p=ps[i],n=N_trials[i], value=N_yes[i], observed=True)
mcmc = pm.MCMC([bins, ps])
di mana saya percaya saya membutuhkan prior untuk a
dan b
. Bagaimana saya harus memilih satu?