Langkah-langkah untuk mencari tahu distribusi posterior ketika mungkin cukup sederhana untuk memiliki bentuk analitik?


12

Ini juga ditanyakan di Computational Science.

Saya mencoba menghitung perkiraan Bayesian dari beberapa koefisien untuk autoregresi, dengan 11 sampel data: mana adalah Gaussian dengan rerata 0 dan varians Distribusi sebelumnya pada vektor adalah Gaussian dengan rerata dan matriks kovarians diagonal dengan entri diagonal sama dengan .

Yi=μ+αYi1+ϵi
ϵiσe2(μ,α)t(0,0)σp2

Berdasarkan rumus autoregresi, ini berarti bahwa distribusi titik data ( ) normal dengan rata-rata dan varians . Jadi, kepadatan untuk semua titik data bersama-sama (dengan asumsi independensi, yang baik untuk program yang saya tulis), akan menjadi:Yiμ+αYi1σe2(Y)

p(Y|(μ,α)t)=i=21112πσe2exp(YiμαYi1)22σe2.

Dengan teorema Bayes, kita dapat mengambil produk dari kepadatan di atas dengan kepadatan sebelumnya, dan kemudian kita hanya perlu konstanta normalisasi. Firasat saya adalah ini seharusnya berfungsi sebagai distribusi Gaussian, jadi kita bisa khawatir tentang konstanta normalisasi pada akhirnya daripada secara eksplisit menghitungnya dengan integral atas dan .αμα

Ini adalah bagian yang membuat saya kesulitan. Bagaimana cara saya menghitung perkalian kepadatan sebelumnya (yang multivariat) dan produk ini dari kepadatan data univariat? Posterior harus murni kepadatan dan , tapi saya tidak bisa melihat bagaimana Anda akan keluar dari produk seperti itu.αμα

Setiap pointer sangat membantu, bahkan jika Anda hanya mengarahkan saya ke arah yang benar dan kemudian saya harus pergi dan melakukan aljabar berantakan (yang sudah saya coba beberapa kali).

Sebagai titik awal, berikut adalah bentuk pembilang dari aturan Bayes:

1(2πσe2)52πσp2exp[12σe2i=211(YiμαYi1)2μ22σp2α22σp2].

Masalahnya adalah bagaimana melihat bahwa ini berkurang hingga kepadatan Gaussian .(μ,α)t

Ditambahkan

Pada akhirnya, ini bermuara pada masalah umum berikut. Jika Anda diberi beberapa ekspresi kuadratik seperti bagaimana Anda menempatkannya dalam bentuk kuadratik untuk beberapa matriks 2x2 ? Ini cukup sederhana dalam kasus mudah, tetapi proses apa yang Anda gunakan untuk mendapatkan estimasi rata-rata, dan ?( μ - μ , α - α ) Q ( μ - μ , α - α ) t Q μ α

Aμ2+Bμα+Cα2+Jμ+Kα+L
(μμ^,αα^)Q(μμ^,αα^)tQμ^α^

Catatan, saya mencoba opsi langsung untuk memperluas rumus matriks dan kemudian mencoba untuk menyamakan koefisien seperti di atas. Masalahnya, dalam kasus saya, adalah bahwa konstanta adalah nol, dan kemudian saya akhirnya mendapatkan tiga persamaan dalam dua yang tidak diketahui, sehingga tidak ditentukan untuk hanya mencocokkan koefisien (bahkan jika saya mengasumsikan matriks bentuk kuadrat simetris).L


Jawaban saya untuk [pertanyaan ini] ( stats.stackexchange.com/questions/22852/… ) dapat membantu. Perhatikan bahwa Anda memerlukan prior untuk pengamatan pertama Anda - iterasi berhenti di sana.
probabilityislogic

Saya tidak mengerti mengapa saya membutuhkannya dalam kasus ini. Saya seharusnya memperlakukan interval waktu seolah-olah mereka independen bersyarat diberikan pengamatan. Perhatikan bahwa produk kerapatan sambungan hanya dari . Saya tidak berpikir saya seharusnya mendapatkan formula yang diperbarui secara berurutan di sini, hanya rumus tunggal untuk posterior . p ( ( μ , α ) ti=2..11p((μ,α)t|Y)
ely

"Multivariat" pada sebelumnya tidak bertentangan dengan "univariat" dalam kepadatan data, karena mereka adalah kepadatan dalam . y ip(α,μ)yi
Xi'an

Jawaban:


7

Petunjuk yang ada dalam jawaban saya untuk jawaban sebelumnya adalah untuk melihat bagaimana saya mengintegrasikan parameter - karena Anda akan melakukan integral yang persis sama di sini. Pertanyaan Anda mengasumsikan parameter varians diketahui, sehingga mereka adalah konstanta. Anda hanya perlu melihat ketergantungan pada pembilang. Untuk melihat ini, perhatikan bahwa kita dapat menulis:α,μ

= 1

p(μ,α|Y)=p(μ,α)p(Y|μ,α)p(μ,α)p(Y|μ,α)dμdα
=1(2πσe2)52πσp2exp[12σe2i=211(YiμαYi1)2μ22σp2α22σp2]1(2πσe2)52πσp2exp[12σe2i=211(YiμαYi1)2μ22σp2α22σp2]dμdα

Perhatikan bagaimana kita dapat menarik faktor pertama keluar dari integral ganda pada penyebut, dan dibatalkan dengan pembilang. Kita juga dapat menarik jumlah kuadrat dan itu juga akan membatalkan. Integral yang tersisa sekarang adalah (setelah memperluas istilah kuadrat): exp [ -11(2πσe2)52πσp2exp[12σe2i=211Yi2]

=exp[10μ2+α2i=110Yi22μi=211Yi2αi=211YiYi1+2μαi=110Yi2σe2μ22σp2α22σp2]exp[10μ2+α2i=110Yi22μi=211Yi2αi=211YiYi1+2μαi=110Yi2σe2μ22σp2α22σp2]dμdα

Sekarang kita dapat menggunakan hasil umum dari pdf normal.

-az2+bzczμa=10

exp(az2+bzc)dz=πaexp(b24ac)
Ini mengikuti menyelesaikan persegi pada dan mencatat bahwa tidak bergantung pada . Perhatikan bahwa integral dalam adalah dalam bentuk ini dengan dan dan . Setelah melakukan integral ini, Anda akan menemukan bahwa integral yang tersisa lebih dariaz2+bzczμ b=Σ 11 i = 2 Yi-aΣ 10 i = 1 Yia=102σe2+12σp2 c=α2 10 i = 1 Y 2 i -2α 11 i = 2 YiYi i-1b=i=211Yiαi=110Yiσe2 αa,b,c1c=α2i=110Yi22αi=211YiYi12σe2+α22σp2αjuga dari formulir ini, sehingga Anda dapat menggunakan rumus ini lagi, dengan . Maka Anda harus dapat menulis posterior Anda dalam bentuk mana adalah matriksa,b,c V 2 × 212π|V|12exp[12(μμ^,αα^)V1(μμ^,αα^)T]V2×2

Beri tahu saya jika Anda membutuhkan lebih banyak petunjuk.

memperbarui

(catatan: rumus yang benar, harus bukan )μ 210μ2μ2

jika kita melihat bentuk kuadratik yang Anda tulis dalam pembaruan, kami melihat ada koefisien ( tidak relevan untuk posterior karena kami selalu dapat menambahkan konstanta yang akan dibatalkan dalam penyebut). Kami juga memiliki tidak diketahui . Karenanya ini adalah masalah "berpose bagus" selama persamaannya bebas linear. Jika kita memperluas kuadratik kita dapatkan:L 5 μ , α ,5L5μ^,α^,Q11,Q12=Q21,Q22(μμ^,αα^)Q(μμ^,αα^)t

Q 12 α ) μ - ( 2 Q 22 α

Q11(μμ^)2+Q22(αα^)2+2Q12(μμ^)(αα^)
=Q11μ2+2Q21μα+Q22α2(2Q11μ^+2Q12α^)μ(2Q22α^+2Q12μ^)α+
+Q11μ^2+Q22α^2+2Q12μ^α^

Membandingkan koefisien urutan kedua, kita mendapatkan yang memberi tahu kita seperti apa bentuk matriks kovarians (terbalik). Juga kita memiliki dua persamaan sedikit lebih rumit untuk setelah menggantikan . Ini dapat ditulis dalam bentuk matriks sebagai:A=Q11,B=2Q12,C=Q22α^,μ^Q

(2ABB2C)(μ^α^)=(JK)

Jadi estimasi diberikan oleh:

(μ^α^)=(2ABB2C)1(JK)=14ACB2(BK2JCBJ2KA)

Menunjukkan bahwa kami tidak memiliki taksiran unik kecuali . Sekarang kita memiliki: 4ACB2

A=102σe2+12σp2B=i=110Yiσe2C=i=110Yi22σe2+12σp2J=i=211Yiσe2K=i=211YiYi1σe2

Perhatikan bahwa jika kita mendefinisikan untuk dan mengambil batas maka perkiraan untuk diberikan oleh kuadrat terkecil yang biasa estimasi dan mana dan . Jadi estimasi posterior adalah rata-rata tertimbang antara estimasi OLS dan estimasi sebelumnya . i = 2 , , 11 σ 2 pXi=Yi1i=2,,11σp2μ,αα^=i=211(YiY¯)(XiX¯)i=211(XiX¯)2μ^=Y¯α^X¯Y¯=110i=211Yi(0,0)X¯=110i=211Xi=110i=110Yi(0,0)


Ini tidak terlalu membantu karena saya menyebutkan secara spesifik bahwa bukan penyebut yang penting di sini. Penyebut hanya konstanta normalisasi, yang akan terlihat jelas setelah Anda mengurangi pembilangnya menjadi bentuk Gaussian. Jadi trik untuk mengevaluasi integral dalam penyebut secara matematis sangat keren, tetapi tidak diperlukan untuk aplikasi saya. Satu-satunya masalah yang perlu saya selesaikan adalah memanipulasi pembilang.
ely

Jawaban ini memberi Anda pembilang dan penyebut. Pembilang menunjukkan polinomial derajat kedua yang tepat dalam yang mengarah ke bentuk kuadrat normal, seperti yang ditekankan oleh probabilityislogic. (α,μ)
Xi'an

@ em - dengan menghitung konstanta normalisasi Anda akan membangun bentuk kuadratik yang diperlukan. itu akan berisi persyaratan yang diperlukan untuk melengkapi kuadrat
probabilityislogic

Saya tidak mengerti bagaimana ini memberi Anda bentuk kuadratik. Saya telah mengerjakan dua integral dalam penyebut menggunakan identitas integral Gaussian yang Anda poskan. Pada akhirnya, saya hanya mendapatkan konstanta yang besar dan berantakan. Tampaknya tidak ada cara yang jelas untuk mengambil konstanta itu dan mengubahnya menjadi sesuatu yang menentukan faktor 1/2, dll. Belum lagi saya tidak melihat bagaimana semua ini menjelaskan bagaimana menghitung yang baru ' berarti vektor ' .. Inilah yang saya minta bantuan dalam pertanyaan awal. (μ^,α^)t
ely

Terima kasih banyak untuk penambahan detailnya. Saya membuat beberapa kesalahan konyol ketika mencoba melakukan aljabar untuk mengetahui bentuk kuadratik. Komentar Anda tentang kaitannya dengan estimator OLS juga sangat menarik dan dihargai. Saya pikir ini akan mempercepat kode saya karena saya akan dapat mengambil sampel dari bentuk analitik yang memiliki built-in, metode yang dioptimalkan. Rencana awal saya adalah menggunakan Metropolis-Hastings untuk mengambil sampel dari ini, tetapi sangat lambat. Terima kasih!
ely
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.