Saya mencoba untuk melakukan pengujian A / B dengan cara Bayesian, seperti dalam Probabilistic Programming for Hackers dan Bayesian A / B tes . Kedua artikel berasumsi bahwa pembuat keputusan memutuskan varian mana yang lebih baik hanya berdasarkan probabilitas beberapa kriteria, misalnya , oleh karena itu, lebih baik. Probabilitas ini tidak memberikan informasi apa pun tentang apakah ada jumlah data yang cukup untuk menarik kesimpulan darinya. Jadi, tidak jelas bagi saya, kapan harus menghentikan tes.A
Misalkan ada dua RVs biner, dan , dan saya ingin memperkirakan berapa besar kemungkinan , dan berdasarkan pengamatan dari dan . Selain itu, anggap saja dan secara beta.B p A > p B p A - p BABpApB
Karena saya dapat menemukan parameter untuk dan , saya dapat mengambil sampel posisi, dan memperkirakan . Contoh dalam python:p Ap BP ( p A > p B | data )
import numpy as np
samples = {'A': np.random.beta(alpha1, beta1, 1000),
'B': np.random.beta(alpha2, beta2, 1000)}
p = np.mean(samples['A'] > samples['B'])
Saya bisa mendapatkan, misalnya, . Sekarang saya ingin memiliki sesuatu seperti .P ( p A > p B | data ) = 0,95 ± 0,03
Saya telah meneliti tentang interval yang kredibel dan faktor Bayes, tetapi tidak dapat memahami bagaimana menghitungnya untuk kasus ini jika mereka berlaku sama sekali. Bagaimana saya bisa menghitung statistik tambahan ini sehingga saya memiliki kriteria terminasi yang baik?