θ
y1, . . . , yny= ( y1, . . . , yn)T
y1, . . . , yn| θ∼N( θ , σ2)
Atau lebih sering ditulis oleh Bayesian,
y1, . . . , yn| θ∼N( θ , τ)
τ= 1 / σ2τ
ysaya
f( ysaya| θ,τ) = (√τ2 π) × e x p ( - τ( ysaya- θ )2/ 2 )
θ^= y¯
θ
θ ∼ N( a , 1 / b )
Distribusi posterior yang kita peroleh dari model data Normal-Normal (setelah banyak aljabar) ini adalah distribusi Normal lainnya.
θ | y∼ N( bb + n τa + n τb + n τy¯, 1b + n τ)
b + n τSebuahy¯bb + n τa + n τb + n τy¯
θ | yθθ
Yang mengatakan, Anda sekarang dapat menggunakan contoh buku teks data normal untuk menggambarkan hal ini. Saya akan menggunakan kumpulan data airquality
dalam R. Pertimbangkan masalah memperkirakan kecepatan angin rata-rata (MPH).
> ## New York Air Quality Measurements
>
> help("airquality")
>
> ## Estimating average wind speeds
>
> wind = airquality$Wind
> hist(wind, col = "gray", border = "white", xlab = "Wind Speed (MPH)")
>
> n = length(wind)
> ybar = mean(wind)
> ybar
[1] 9.957516 ## "frequentist" estimate
> tau = 1/sd(wind)
>
>
> ## but based on some research, you felt avgerage wind speeds were closer to 12 mph
> ## but probably no greater than 15,
> ## then a potential prior would be N(12, 2)
>
> a = 12
> b = 2
>
> ## Your posterior would be N((1/))
>
> postmean = 1/(1 + n*tau) * a + n*tau/(1 + n*tau) * ybar
> postsd = 1/(1 + n*tau)
>
> set.seed(123)
> posterior_sample = rnorm(n = 10000, mean = postmean, sd = postsd)
> hist(posterior_sample, col = "gray", border = "white", xlab = "Wind Speed (MPH)")
> abline(v = median(posterior_sample))
> abline(v = ybar, lty = 3)
>
> median(posterior_sample)
[1] 10.00324
> quantile(x = posterior_sample, probs = c(0.025, 0.975)) ## confidence intervals
2.5% 97.5%
9.958984 10.047404
Dalam analisis ini, peneliti (Anda) dapat mengatakan bahwa data yang diberikan + informasi sebelumnya, perkiraan angin rata-rata Anda, menggunakan persentil ke-50, kecepatannya harus 10.00324, lebih besar daripada hanya menggunakan rata-rata dari data tersebut. Anda juga mendapatkan distribusi penuh, dari mana Anda dapat mengekstrak interval yang kredibel 95% menggunakan kuantil 2,5 dan 97,5.
Di bawah ini saya sertakan dua referensi, saya sangat merekomendasikan membaca makalah pendek Casella. Ini secara khusus ditujukan pada metode Bayes empiris, tetapi menjelaskan metodologi Bayesian umum untuk model Normal.
Referensi:
Casella, G. (1985). Pengantar Analisis Data Teluk Empiris. The American Statistician, 39 (2), 83-87.
Gelman, A. (2004). Analisis data Bayesian (edisi kedua, Teks dalam ilmu statistik). Boca Raton, Fla .: Chapman & Hall / CRC.