Apa perbedaan antara DP dan CRP?
Chinese Restaurant Process (CRP) adalah distribusi melalui partisi bilangan bulat . Koneksi ke Proses Dirichlet (DP) ada berkat teorema De Finetti.
Teorema De Finetti: Misalkan kita memiliki proses acak yang dapat dipertukarkan tanpa batas , maka probabilitas gabungan memiliki representasi sebagai campuran:(θ1, ... ,θN)p (θ1, ... ,θN)
p (θ1, ... ,θN) = ∫dP( G )∏i = 1NG (θsaya)
untuk beberapa variabel acak .G
The dipertukarkan properti berarti bahwa kita tidak peduli tentang baik indeks dari tabel (kita tidak nama tabel) dan kami tidak peduli tentang urutan pelanggan di meja tertentu. Partisi pelanggan ke dalam set yang berbeda adalah satu-satunya struktur yang kami tertarik. Ini berarti bahwa mengingat sebuah partisi kita tidak perlu mengetahui penugasan khusus pelanggan ke tabel, kita hanya perlu mengetahui jumlah pelanggan di setiap tabel.
Teorema de Finetti ini tidak membantu dalam menemukan distribusi . Hanya menyatakan bahwa itu harus ada.G
Proses Dirichlet adalah pendahuluan dari distribusi . Secara informal, Anda memasukkan distribusi probabilitas dan ketika Anda mengambil sampel darinya, Anda akan mendapatkan distribusi probabilitas setelah distribusi probabilitas.
Hubungan antara keduanya dapat dibangun dengan membuktikan bahwa jika diambil sampelnya dari Proses Dirichlet, persamaan dalam teorema De Finetti berlaku untuk tertentu .GG
Jika
G ∼ D P( α , H)
kemudian
p ( {θ( z= 0)0, ... ,θ( z= 0)n0} , ... , {θ( z= k)0, ... ,θ( z= k)nk} ) =αkΓ ( α )Γ ( α + n )∏i = 0kΓ (nsaya)
Catat itu p (θ1, ... ,θN)dijelaskan oleh CRP melalui probabilitas untuk partisi tertentu. Siniz= i menunjukkan indeks tabel saya. Dannsaya adalah jumlah pelanggan di meja saya. Demi kelengkapan, ingat bahwaD P adalah:
{ G (SEBUAH1) , ... , G (SEBUAHk) } ∼ D i r i c h l e t ( α H(SEBUAH1) , … , Α H(SEBUAHk) )
Saya pikir jelas dari paparan ini bahwa koneksi itu ada, tetapi tidak boleh dianggap sepele. Perhatikan juga bahwa saya tidak menggambarkan CRP dalam arti distribusi bersyarat atas pelanggan individu yang masuk. Ini akan menambah langkah konseptual lain antara CRP dan DP. Saran saya: merasa bebas tentang merasa tidak nyaman dengan memahami secara langsung hubungan mereka dan mulai bermain-main dengan menggambarkan distribusi bersama dan marjinal sampai Anda mereproduksi koneksi. CRP diperoleh dengan meminggirkanG dari DP.
Untuk hubungan antara probabilitas gabungan dan deskripsi sekuensial CRP, lihat [1].
Bagaimana jika pertukaran tidak berlaku?
Jika pertukaran tidak berlaku, kita tidak berbicara lagi tentang DP atau CRP, tetapi tentang Proses Dirichlet Tergantung dan Proses Restoran Cina Tergantung. Dan tentu saja, hubungan di antara mereka hilang!
Lihat [2] untuk detailnya. CRP Dependent menjelaskan pelanggan mana yang ingin duduk dengan (lajang) lainnya. Dengan mengelompokkan semua hubungan pelanggan-pelanggan, kami dapat menetapkan sebuah tabel. Dependent CRP tidak sedikit berbeda: probabilitas partisi saat mengeluarkan pelanggan juga tergantung pada pelanggan tersebut. Sebaliknya, Dependent DP sering didefinisikan oleh yang sangat marjinal ini:Gt∼ D P( α , H). SiniH misalnya distribusi Dirichlet itu sendiri atau distribusi apa pun yang menyebabkannya Gt dan Gt′ untuk berhubungan.
Ada banyak generalisasi yang mungkin, beberapa dari mereka akan mengakui representasi atas partisi serta distribusi, seperti Proses Restoran Cina dengan dua parameter dengan Proses Pitman-Yor, atau Proses Prasmanan India dengan Proses Beta [3] . Beberapa dari mereka tidak mau.
- [1] : Tutorial Model Bayesian Nonparametric (2011) Gershman dan Blei
- [2] : Proses Restoran Tiongkok Jarak Jauh (2011) Blei dan Frazier
- [3] : Proses Beta Hirarkis dan Proses Prasmanan India (2007) Thibaux dan Jordan