Kami sedang menyelidiki uji statistik Bayesian, dan menemukan fenomena aneh (bagi saya setidaknya).
Pertimbangkan kasus berikut: kami tertarik untuk mengukur populasi mana, A atau B, yang memiliki tingkat konversi yang lebih tinggi. Untuk pemeriksaan kewarasan, kami menetapkan , yaitu probabilitas konversi sama di kedua grup. Kami menghasilkan data buatan menggunakan model binomial, misalnya
Kami kemudian mencoba memperkirakan menggunakan model beta-binomial Bayesian sehingga kami mendapatkan posisi untuk setiap tingkat konversi, mis.
Statistik pengujian kami dihitung dengan menghitung melalui monte carlo.
Yang mengejutkan saya adalah jika , maka S \ sim \ text {Uniform (0,1)} . Pikiranku adalah bahwa itu akan berpusat di sekitar 0,5, dan bahkan bertemu menjadi 0,5 ketika ukuran sampel, N , bertambah.
Pertanyaan saya adalah, mengapa saat ?
Berikut beberapa kode Python untuk diperagakan:
%pylab
from scipy.stats import beta
import numpy as np
import pylab as P
a = b = 0.5
N = 10000
samples = [] #collects the values of S
for i in range(5000):
assert a==b
A = np.random.binomial(N, a); B = np.random.binomial(N, b)
S = (beta.rvs(A+1, N-A+1, size=15000) > beta.rvs(B+1, N-B+1, size=15000)).mean()
samples.append(S)
P.hist(samples)
P.show()
R