Sepertinya ketika saya melihat-lihat algoritma pembelajaran yang modis, hal-hal seperti jaringan saraf, pohon-pohon yang dikuatkan, mesin vektor pendukung, hutan acak, dan teman-teman dipromosikan untuk masalah pembelajaran yang diawasi. Proses Dirichlet dan sejenisnya tampaknya sebagian besar disebutkan dalam masalah belajar tanpa pengawasan, seperti pengelompokan dokumen atau gambar. Saya melihat mereka terbiasa dengan masalah regresi, atau sebagai prior purpose priors ketika seseorang ingin melakukan statistik Bayesian dalam cara nonparametrik atau semiparametrik (misalnya sebagai fleksibel sebelum distribusi efek acak dalam model tertentu) tetapi pengalaman saya yang terbatas menunjukkan bahwa ini tidak banyak berasal dari kerumunan pembelajaran mesin seperti halnya dari ahli statistik yang lebih tradisional. Saya telah melakukan sedikit pencarian di Google dan saya
Jadi, apakah proses Dirichlet dan sepupunya paling efektif sebagai prior untuk model pengelompokan yang fleksibel? Apakah mereka tidak bersaing dengan meningkatkan, SVM, dan jaringan saraf untuk masalah pembelajaran yang diawasi? Apakah mereka hanya berguna dalam situasi tertentu untuk masalah ini? Atau apakah kesan umum saya salah?