Implementasi: Paket topicmodels menyediakan antarmuka ke kode GSL C dan C ++ untuk model topik oleh Blei et al. dan Phan et al. Untuk yang sebelumnya menggunakan Variational EM, untuk Gibbs Sampling yang terakhir. Lihat http://www.jstatsoft.org/v40/i13/paper . Paket ini berfungsi dengan baik dengan utilitas dari paket tm.
Paket lda menggunakan Gibbs Sampler yang diciutkan untuk sejumlah model yang mirip dengan yang dari perpustakaan GSL. Namun, ini telah diimplementasikan oleh penulis paket itu sendiri, bukan oleh Blei et al. Oleh karena itu implementasi ini berbeda secara umum dari teknik estimasi yang diusulkan dalam makalah asli yang memperkenalkan varian model ini, di mana algoritma VEM biasanya diterapkan. Di sisi lain, paket menawarkan lebih banyak fungsi daripada paket lainnya. Paket ini juga menyediakan fungsionalitas penambangan teks.
Extensibility: Mengenai ekstensibilitas, kode model topik pada dasarnya dapat diperluas untuk antarmuka kode model topik lainnya yang ditulis dalam C dan C ++. Paket lda tampaknya lebih mengandalkan implementasi spesifik yang disediakan oleh penulis, tetapi ada Gibbs sampler yang memungkinkan menentukan model topik Anda sendiri. Untuk masalah ekstensibilitas bukan yang pertama, yang pertama dilisensikan di bawah GPL-2 dan LGPL yang terakhir, jadi itu mungkin tergantung pada apa yang Anda perlu memperpanjang untuk (GPL-2 lebih ketat mengenai aspek open source, yaitu Anda tidak dapat menggunakannya dalam perangkat lunak berpemilik).
Kinerja: Saya tidak dapat membantu Anda di sini, saya hanya menggunakan model topik sejauh ini.
Kesimpulan:
Secara pribadi saya menggunakan topicmodels
, karena didokumentasikan dengan baik (lihat makalah JSS di atas) dan saya percaya penulis (Grün juga menerapkan flexmix dan Hornik adalah anggota inti R).