Karena tujuan di sini mungkin untuk mendapatkan beberapa estimasi valid dan berguna , distribusi sebelumnya harus konsisten dengan spesifikasi distribusi populasi dari mana sampel berasal. Ini TIDAK berarti bahwa kami "menghitung" sebelum menggunakan sampel itu sendiri - ini akan membatalkan validitas seluruh prosedur. Kita tahu bahwa populasi dari mana sampel berasal adalah populasi dari variabel acak seragam iid masing-masing berkisar pada . Ini adalah asumsi yang dipertahankan dan merupakan bagian dari informasi sebelumnya yang kami miliki (dan tidak ada hubungannya dengan sampel , yaitu dengan realisasi spesifik dari subset dari variabel acak ini).[ 0 , θ ]θ[0,θ]
Sekarang asumsikan bahwa populasi ini terdiri dari variabel acak, (sedangkan sampel kami terdiri dari realisasi dari variabel acak). Asumsi yang dipertahankan memberitahu kita bahwa
n < m n max i = 1 , . . . , N { X i } ≤ max j = 1 , . . . , m { X j } ≤ θmn<mn
maxi=1,...,n{Xi}≤maxj=1,...,m{Xj}≤θ
untuk kekompakan . Kemudian kita memiliki yang juga dapat ditulis
θ ≥ X ∗ θ = c X ∗maxi=1,...,n{Xi}≡X∗θ≥X∗
θ=cX∗c≥1
Fungsi densitas dari of iid Uniform rv berkisar pada adalah
N [ 0 , θ ] f X ∗ ( x ∗ ) = N ( x ∗ ) N - 1maxN[0,θ]
fX∗(x∗)=N(x∗)N−1θN
untuk dukungan , dan nol di tempat lain. Kemudian dengan menggunakan dan menerapkan rumus perubahan variabel kami memperoleh distribusi sebelumnya untuk yang konsisten dengan asumsi yang dipertahankan:
θ = c X * θ f p ( θ ) = N ( θ[0,θ]θ=cX∗θ
fp(θ)=N(θc)N−1θN1c=NcNθ−1θ∈[x∗,∞]
yang mungkin tidak tepat jika kita tidak menentukan konstanta sesuai. Tetapi minat kami terletak pada memiliki posterior yang tepat untuk , dan juga, kami tidak ingin membatasi nilai-nilai yang mungkin dari (di luar batasan yang tersirat oleh asumsi yang dipertahankan). Jadi kita meninggalkan tidak ditentukan.
Kemudian tulis posteriornyaq q c X = { x 1 , . . , x n }cθθc
X={x1, . . , xn}
f( θ ∣ X )∝θ- NNcNθ- 1⇒ f( θ ∣ X ) = A NcNθ- ( N+ 1 )
untuk beberapa konstanta normalisasi A. Kami ingin
∫Sθf( θ ∣ X ) dθ = 1 ⇒ ∫∞x∗A NcNθ- ( N+ 1 )dθ = 1
⇒ A NcN1- Nθ- N∣∣∞x∗= 1 ⇒ A = ( c x∗)N
Memasukkan ke dalam posterior
f( θ ∣ X ) = ( c x∗)NNcNθ- ( N+ 1 )= N( x∗)Nθ- ( N+ 1 )
Perhatikan bahwa konstanta tidak ditentukan dari distribusi sebelumnya telah dengan mudah dibatalkan.c
Posterior merangkum semua informasi yang dapat diberikan sampel spesifik tentang nilai . Jika kita ingin mendapatkan nilai spesifik untuk kita dapat dengan mudah menghitung nilai yang diharapkan dari posterior,
θ E ( θ ∣ X ) = ∫ ∞ x ∗ θ N ( x ∗ ) N θ - ( N + 1 ) d θ = - Nθθ
E( θ ∣ X ) = ∫∞x∗θ N( x∗)Nθ- ( N+ 1 )dθ = - NN- 1( x∗)Nθ- N+ 1∣∣∞x∗= NN- 1x∗
Apakah ada intuisi dalam hasil ini? Nah, ketika jumlah meningkat, semakin besar kemungkinan bahwa realisasi maksimum di antara mereka akan semakin dekat dengan batas atas mereka, - yang persis seperti nilai rata-rata posterior mencerminkan: jika, katakanlah , , tetapi jika . Ini menunjukkan bahwa taktik kami mengenai pemilihan sebelumnya adalah masuk akal dan konsisten dengan masalah yang ada, tetapi belum tentu "optimal" dalam arti tertentu.θ θ N = 2 ⇒ E ( θXθθN= 2 ⇒ E( θ ∣ X ) = 2 x∗N= 10 ⇒ E( θ ∣ X ) = 109x∗