Mengapa non-negatif penting untuk sistem penyaringan / rekomendasi kolaboratif?

Dalam semua sistem rekomendasi modern yang telah saya lihat yang mengandalkan faktorisasi matriks, faktorisasi matriks non-negatif dilakukan pada matriks pengguna-film. Saya bisa mengerti mengapa non-negatif itu penting untuk interpretabilitas dan / atau jika Anda ingin faktor jarang. Tetapi jika Anda hanya peduli dengan kinerja prediksi, seperti dalam kompetisi hadiah Netflix misalnya, mengapa memaksakan pembatasan non-negatif? Tampaknya akan benar-benar lebih buruk daripada membiarkan nilai negatif juga dalam faktorisasi Anda.

Makalah ini adalah salah satu contoh yang sangat dikutip dari penggunaan faktorisasi matriks non-negatif dalam penyaringan kolaboratif.

— Lembik
sumber

Saya tidak terlalu mengenal sistem rekomendasi (mungkin Anda bisa memasukkan beberapa makalah contoh dalam pertanyaan Anda?). Jika pola preferensi NNMF yang Anda simpulkan benar, maka jawaban yang paling mungkin adalah meningkatkan generalisasi. Dengan kata lain, mungkin secara empiris kurangnya "interpretabilitas / sparseness" terkait dengan over-fitting . Namun jarang pengkodean (yaitu L1 regularisasi / LASSO) dapat memenuhi persyaratan ini sejauh yang saya tahu. (Bisa jadi NNMF memiliki interpretabilitas yang lebih tinggi.)

— GeoMatt22

Saya bukan spesialis dalam sistem rekomendasi, tetapi sejauh yang saya mengerti, premis dari pertanyaan ini salah.

Non-negatif tidak begitu penting untuk penyaringan kolaboratif.

Hadiah Netflix dimenangkan pada tahun 2009 oleh tim BellKor. Berikut ini makalah yang menjelaskan algoritme mereka: The BellKor 2008 Solution to the Netflix Prize . Karena mudah dilihat, mereka menggunakan pendekatan berbasis SVD:

Fondasi kemajuan kami selama 2008 dituangkan dalam makalah KDD 2008 [4]. [...] Dalam makalah [4] kami memberikan deskripsi rinci tentang tiga model faktor. Yang pertama adalah SVD sederhana [...] Model kedua [...] kita akan menyebut model ini sebagai "Asymmetric-SVD". Akhirnya, model faktor yang lebih akurat, diberi nama "SVD ++" [...]

Lihat juga penulisan lebih populer ini oleh tim yang sama teknik Matriks faktorisasi untuk sistem merekomendasikan . Mereka berbicara banyak tentang SVD tetapi tidak menyebutkan NNMF sama sekali.

Lihat juga posting blog populer ini Pembaruan Netflix: Coba Ini di Rumah dari 2006, juga menjelaskan ide SVD.

Tentu saja Anda benar dan ada beberapa pekerjaan menggunakan NNMF untuk penyaringan kolaboratif juga. Jadi apa yang lebih baik, SVD atau NNMF? Saya tidak tahu, tapi inilah kesimpulan dari Studi Komparatif Algoritma Penyaringan Kolaboratif dari 2012:

Metode berbasis faktor-Matriks umumnya memiliki akurasi paling tinggi. Khususnya, SVD, PMF yang teregulasi, dan variasinya berkinerja terbaik sejauh MAE dan RMSE, kecuali dalam situasi yang sangat jarang, di mana NMF melakukan yang terbaik.

— amuba
sumber

Secara umum ini adalah jawaban yang bagus. Tetapi hanya untuk memperbaiki beberapa fakta, solusi BellKor 2008 memenangkan hadiah kemajuan. Algoritma pemenang keseluruhan adalah campuran dari lebih dari 100 prediktor (Töscher et al. 2009). NMF juga bagian dari itu.

— dpelisek