Saya perlu mengimplementasikan program yang akan mengklasifikasikan catatan ke dalam 2 kategori (benar / salah) berdasarkan beberapa data pelatihan, dan saya bertanya-tanya di algoritma / metodologi mana yang harus saya perhatikan. Tampaknya ada banyak dari mereka untuk dipilih - Jaringan Syaraf Tiruan, Algoritma Genetika, Pembelajaran Mesin, Optimasi Bayesian dll. Dll., Dan saya tidak yakin harus mulai dari mana. Jadi, pertanyaan saya adalah: Bagaimana saya harus memilih algoritma pembelajaran yang harus saya gunakan untuk masalah saya?
Jika ini membantu, inilah masalah yang harus saya pecahkan.
Data pelatihan: Data
pelatihan terdiri dari banyak baris seperti ini:
Precursor1, Precursor2, Boolean (true/false)
Lari
saya akan diberi banyak prekursor.
Kemudian,
- Saya memilih algoritma A dari berbagai algoritma (atau menghasilkan algoritma secara dinamis), dan menerapkannya pada setiap kemungkinan kombinasi prekursor ini dan mengumpulkan "catatan" yang dipancarkan. "Catatan" terdiri dari beberapa pasangan nilai kunci *.
Saya menerapkan beberapa algoritma yang luar biasa dan mengklasifikasikan catatan ini ke dalam 2 kategori (benar / salah).
Saya akan menghasilkan tabel yang memiliki format yang sama dengan data kereta:
Precursor1, Precursor2, Boolean
Dan seluruh program dinilai berdasarkan berapa banyak benar / salah saya benar.
*: "Rekam" akan terlihat seperti ini (harap ini masuk akal)
Record [1...*] Score
-Precursor1 -Key
-Precursor2 -Value
Hanya ada sejumlah Kunci yang mungkin. Catatan berisi subset berbeda dari kunci-kunci ini (beberapa catatan memiliki key1, key2, key3 ... catatan lain memiliki key3, key4 ... dll).
Saya sebenarnya butuh 2 pembelajaran. Salah satunya adalah untuk langkah 1. Saya perlu memiliki modul yang melihat pasangan Prekursor dll dan memutuskan algoritma apa yang akan diterapkan untuk memancarkan catatan untuk perbandingan. Lain untuk langkah 2. Saya membutuhkan modul yang menganalisis koleksi catatan dan mengkategorikannya ke dalam 2 kategori (benar / salah).
Terima kasih sebelumnya!