Bagaimana cara membuat sistem pemberi rekomendasi yang mengintegrasikan fitur pemfilteran kolaboratif dan konten?

10

Saya membuat Sistem Rekomendasi dan ingin menggabungkan peringkat pengguna "serupa" dan fitur item. Outputnya adalah peringkat yang diprediksi [0-1]. Saya sedang mempertimbangkan Neural Network (untuk memulai).

Jadi, input adalah kombinasi dari fitur item dan peringkat setiap pengguna. Untuk item A dan pengguna 1, sistem dapat dilatih tentang data gabungan, A1. Ini akan menjadi salah satu contoh pelatihan.

Bagaimana jika pengguna 1 juga memberi peringkat film B? Lalu apakah data B1 juga akan menjadi contoh pelatihan? Apakah ada masalah dengan mengulangi pelatihan dengan fitur pengguna 1 dengan cara ini?

Apakah Anda punya saran tentang cara yang lebih baik untuk mendekati masalah?

recommender-system

— B Tujuh
sumber

11

Mengapa Anda mempertimbangkan jaringan saraf sebelum sepenuhnya memahami masalahnya?

Metode faktorisasi matriks standar untuk penyaringan kolaboratif dapat memanfaatkan fitur konten dengan mudah. Untuk contoh bagaimana hal ini dapat dilakukan dalam pengaturan Bayesian lihat kertas Matchbox .

— Alexandre Passos
sumber

6

Tiga makalah tentang mengintegrasikan faktorisasi matriks dengan fitur konten (di sini, model topik khusus):

Deepak Agarwal dan Bee-Chung Chen. 2010. fLDA: faktorisasi matriks melalui alokasi balon diri laten. Dalam Prosiding konferensi internasional ACM ketiga tentang pencarian Web dan penambangan data (WSDM '10). ACM, New York, NY, AS, 91-100.
Hanhuai Shan dan Arindam Banerjee. 2010. Faktorisasi Matriks Probabilistik Generalized untuk Penyaringan Kolaboratif. Dalam Prosiding Konferensi Internasional IEEE 2010 tentang Data Mining (ICDM '10). Masyarakat Komputer IEEE, Washington, DC, AS, 1025-1030.
Chong Wang dan David M. Blei. 2011. Pemodelan topik kolaboratif untuk merekomendasikan artikel ilmiah. Dalam Prosiding konferensi internasional ACM SIGKDD ke 17 tentang penemuan pengetahuan dan penambangan data (KDD '11). ACM, New York, NY, AS, 448-456.

Saya juga akan mempromosikan entri blog saya sendiri yang membahas masalah ini sedikit: Model Topik memenuhi Model Faktor Lantent

— Liangjie Hong
sumber

3

Tidak perlu untuk pendekatan jaringan saraf, penyaringan kolaboratif adalah algoritma itu sendiri. Khusus untuk masalah Anda, ada deskripsi yang baik tentang sistem cf dan recomender pada:

ml-class.org

(cari XVI: Sistem Rekomendasi). Ini elegan, sederhana, dan jika Anda melakukannya dengan benar (yaitu, gunakan bentuk vektor, minimizer cepat, dan gradien disiapkan) itu bisa sangat cepat.

— vonPetrushev
sumber

Saya menggunakan pendekatan itu, tetapi tidak menggunakan fitur item. Saya ingin memasukkan fitur juga.

— B Tujuh