Penafian: Saya belum pernah bekerja dengan distribusi ini sebelumnya. Jawaban ini didasarkan pada ini artikel wikipedia dan interpretasi saya itu.
Distribusi Dirichlet adalah distribusi probabilitas multivariat dengan properti yang mirip dengan distribusi Beta.
PDF didefinisikan sebagai berikut:
{ x1, ... , xK} ∼ 1B ( α )∏i = 1Kxαsaya- 1saya
dengan , dan .x i ∈ ( 0 , 1 )K≥ 2xsaya∈ ( 0 , 1 )∑Ki = 1xsaya= 1
Jika kita melihat distribusi Beta yang terkait erat:
{ x1, x2( = 1 - x1) } ∼ 1B ( α , β)xα - 11xβ- 12
kita dapat melihat bahwa kedua distribusi ini sama jika . Jadi mari kita mendasarkan interpretasi kita pada yang pertama dan kemudian menggeneralisasi ke .K > 2K= 2K> 2
Dalam statistik Bayesian, distribusi Beta digunakan sebagai konjugat sebelum parameter binomial (Lihat distribusi Beta ). Sebelumnya dapat didefinisikan sebagai beberapa pengetahuan sebelumnya tentang dan (atau sesuai dengan distribusi Dirichlet dan ). Jika beberapa percobaan binomial kemudian memiliki keberhasilan dan kegagalan, distribusi posterior kemudian sebagai berikut: dan . (Saya tidak akan menyelesaikan ini, karena ini mungkin salah satu hal pertama yang Anda pelajari dengan statistik Bayesian).β α 1αβα1 A B α 1 , p o s = α 1 + Aα2SEBUAHBα1 , p o s= α1+ Aα2 , p o s=α2+ B
Jadi distribusi Beta kemudian mewakili beberapa distribusi posterior pada dan , yang dapat diartikan sebagai probabilitas keberhasilan dan kegagalan masing-masing dalam distribusi Binomial. Dan semakin banyak data ( dan ) yang Anda miliki, semakin sempit distribusi posterior ini.x 2x1A Bx2( = 1 -x1)SEBUAHB
Sekarang kita tahu bagaimana distribusi bekerja untuk , kita dapat menggeneralisasi untuk bekerja untuk distribusi multinomial daripada binomial. Yang berarti bahwa alih-alih dua hasil yang mungkin (berhasil atau gagal), kami akan memungkinkan untuk hasil (lihat mengapa generalisasi ke Beta / Binom jika ?). Masing-masing hasil ini akan memiliki probabilitas , yang berjumlah 1 seperti probabilitas.K= 2KK= 2Kxsaya
α 1αsaya kemudian mengambil peran yang mirip dengan dan dalam distribusi Beta sebagai prior untuk dan diperbarui dengan cara yang sama.α1α2xsaya
Jadi sekarang untuk mendapatkan pertanyaan Anda:
Bagaimana alphas
pengaruhnya terhadap distribusi?
Distribusi dibatasi oleh batasan dan . The menentukan bagian mana dari ruang berdimensi mendapatkan massa paling. Anda dapat melihat ini di gambar ini (tidak menanamkannya di sini karena saya tidak memiliki gambarnya). Semakin banyak data yang ada di posterior (menggunakan interpretasi itu) semakin tinggi , sehingga semakin Anda yakin akan nilai , atau probabilitas untuk setiap hasil. Ini berarti bahwa kepadatan akan lebih terkonsentrasi.∑ K i = 1 x i = 1 α i K ∑ K i =xsaya∈ ( 0, 1 )∑Ki = 1xsaya= 1αsayaK∑Ki = 1αsayaxsaya
Bagaimana alphas
keadaannya dinormalisasi?
Normalisasi distribusi (pastikan integral sama dengan 1) melewati istilah :B ( α )
B ( α ) = ∏Ki = 1Γ ( αsaya)Γ ( ÂKi = 1αsaya)
Sekali lagi jika kita melihat kasus kita dapat melihat bahwa faktor normalisasi sama dengan distribusi Beta, yang menggunakan yang berikut:K= 2
B ( α1, α2) = Γ ( α1) Γ ( α2)Γ ( α1+ α2)
Ini meluas ke
B ( α ) = Γ ( α1) Γ ( α2) ... Γ ( αK)Γ ( α1+ α2+ ⋯ + αK)
Apa yang terjadi ketika alfa bukan bilangan bulat?
Interpretasi tidak berubah untuk , tetapi seperti yang Anda lihat pada gambar yang saya sebelumnya , jika massa distribusi terakumulasi di tepi rentang untuk . di sisi lain harus bilangan bulat dan .α i < 1 x i K K ≥ 2αsaya> 1αsaya< 1xsayaKK≥ 2