Jadi, saya baru mulai belajar bagaimana jaringan saraf dapat beroperasi untuk mengenali pola dan mengategorikan input, dan saya telah melihat bagaimana jaringan saraf tiruan dapat mengurai data gambar dan mengkategorikan gambar ( demo dengan convnetjs ), dan kuncinya ada adalah untuk mengecilkan gambar dan setiap piksel merangsang satu neuron input ke dalam jaringan.
Namun, saya mencoba membungkus kepala saya jika ini mungkin dilakukan dengan input string? Kasing yang saya pakai adalah "mesin rekomendasi" untuk film yang telah ditonton pengguna. Film memiliki banyak data string (judul, plot, tag), dan saya bisa membayangkan "downsampling" teks ke beberapa kata kunci yang menggambarkan film itu, tetapi bahkan jika saya memilah lima kata teratas yang menggambarkan film ini, saya pikir saya perlu input neuron untuk setiap kata bahasa Inggris untuk membandingkan satu set film? Saya dapat membatasi input neuron hanya untuk kata-kata yang digunakan dalam set, tetapi kemudian bisakah itu tumbuh / belajar dengan menambahkan film baru (pengguna menonton film baru, dengan kata-kata baru)? Sebagian besar perpustakaan yang saya lihat tidak mengizinkan penambahan neuron baru setelah sistem dilatih?
Apakah ada cara standar untuk memetakan data string / kata / karakter ke input ke jaringan saraf? Atau apakah jaringan saraf benar-benar bukan alat yang tepat untuk pekerjaan mengurai data string seperti ini (apa alat yang lebih baik untuk pencocokan pola dalam data string)?