Saya sedang membangun jaring saraf untuk memprediksi nilai sebuah karya seni dengan berbagai input (ukuran, media seni, dll.) Dan saya ingin memasukkan penulis sebagai input juga (sering kali sangat besar faktor dalam nilai satu karya seni).
Kekhawatiran saya saat ini adalah bahwa nama penulis bukan input numerik yang ideal untuk NN (yaitu Jika saya hanya kode setiap penulis dengan nilai integer yang meningkat, saya akan secara tidak langsung memberikan nilai lebih kepada penulis lebih jauh ke bawah daftar -_-) . Pikiranku adalah membuat input terpisah untuk semua penulis dalam set data saya dan kemudian hanya menggunakan satu pengkodean panas untuk lebih mewakili input ke NN.
Namun pendekatan ini mengalami masalah ketika penulis yang tidak termasuk dalam data pelatihan saya digunakan sebagai input ke NN (yaitu penulis baru). Saya dapat menyiasatinya dengan bidang input "penulis lain" tetapi saya khawatir ini tidak akan akurat karena saya tidak akan melatih NN untuk input ini (semua karya seni dengan penilaian memiliki penulis).
Saya belum sepenuhnya memikirkan hal ini, tetapi saya berpikir mungkin melatih 2 NN, satu untuk penilaian tanpa penulis dan satu untuk penilaian dengan penulis untuk memastikan saya memiliki data pelatihan yang cukup untuk "penilaian tanpa penulis" agar tetap cukup akurat.
Saya masih mencoba untuk membuat konsep arsitektur NN terbaik sebelum saya terjebak ke dalam implementasi jadi jika ada yang punya saran / komentar saya akan sangat berterima kasih!
Terima kasih sebelumnya, Vince
PS Saya melakukan ini sebagai kompetisi kecil dengan seorang teman untuk menguji NN vs teknik penilaian komersial tradisional. Tolong bantu saya mendapatkan kemenangan untuk Ilmu Komputer atas Ilmu Aktuaria.