Saya memiliki daftar kata-kata, milik berbagai kategori yang ditentukan sendiri. Setiap kategori memiliki pola sendiri (misalnya satu memiliki panjang tetap dengan karakter khusus, yang lain ada karakter yang hanya terjadi dalam kategori "kata", ...).
Sebagai contoh:
"ABC" -> type1
"ACC" -> type1
"a8 219" -> type2
"c 827" -> type2
"ASDF 123" -> type2
"123123" -> type3
...
Saya mencari teknik pembelajaran mesin untuk mempelajari pola ini sendiri, berdasarkan data pelatihan. Saya sudah mencoba mendefinisikan beberapa variabel prediktor (misalnya panjang kata, jumlah karakter khusus, ...) sendiri dan kemudian menggunakan Neural-Networks untuk mempelajari dan memprediksi kategori. Tapi itu sebenarnya bukan yang saya inginkan. Saya ingin teknik untuk mempelajari pola masing-masing kategori sendiri - bahkan untuk mempelajari pola yang tidak pernah saya pikirkan.
Jadi saya memberikan data pembelajaran algoritma (terdiri dari contoh kata-kategori) dan ingin mempelajari pola untuk setiap kategori untuk memprediksi nanti kategori dari kata yang sama atau sama.
Apakah ada cara canggih untuk melakukannya?
Terima kasih atas bantuan Anda