Pertanyaannya, menurut saya, cukup kabur dan melibatkan beberapa kesalahpahaman, jadi jawaban ini hanya berusaha untuk menyediakan kosakata yang tepat dan mengarahkan Anda ke arah yang benar.
Ada dua bidang ilmu komputer yang secara langsung mempelajari masalah tersebut. Inferensi induktif dan teori pembelajaran komputasi . Kedua bidang ini sangat terkait erat dan perbedaannya adalah sosial dan estetika, bukan formal.
Perbaiki alfabet yang terbatas dan himpunan semua bahasa yang terdiri dari kata-kata yang terbatas panjang lebih . Ini adalah semua yang Anda dapat mengekspresikan dalam hal . Sekarang pertimbangkan bahasa . Anda dapat menganggap ini sebagai konsep yang Anda minati. Anda sering harus memperbaiki keluarga konsep yang Anda pedulikan karena, seperti yang telah ditunjukkan orang lain, representasi konsep dan penyajian data sangat penting.P ( A ∗ ) A A F ⊆ P ( A ∗ )AP(A∗)AAF⊆P(A∗)
Bayangkan seorang guru yang akan mengajarkan Anda sebuah konsep. Guru akan memilih salah satu bahasa tanpa sepengetahuan Anda. Guru kemudian akan memberikan informasi kepada Anda tentang bahasa tersebut. Ada banyak presentasi. Yang paling sederhana adalah memberi Anda contoh. Sebuah penyajian data positif adalah fungsi memuaskan yangf:N→A∗
⋃i∈Nf(i)=T, for some T in F.
Jadi, penyajian data positif adalah penghitungan konsep target, seringkali dengan beberapa kondisi kewajaran tambahan. Anda juga dapat meminta presentasi yang melabeli kata-kata tergantung pada apakah mereka dalam bahasa atau tidak. Sekali lagi, Anda dapat menambahkan kondisi tambahan untuk memastikan keadilan dan cakupan semua kata.
Misalkan kita memiliki keluarga representasi bahasa. Itu berarti setiap elemen dari mendefinisikan bahasa . Contoh representasi adalah rumus Boolean, automata terbatas, ekspresi reguler, sistem persamaan linear, bahasa pemrograman domain spesifik, dll. Apa pun yang Anda inginkan, sungguh, kecuali berbagai kondisi biasanya dikenakan untuk memastikan representasi memiliki sifat-sifat penelusuran dasar.M R e p L ( M )RepMRepL(M)
Sebuah pelajar pasif adalah fungsi yang membuat dugaan setelah melihat setiap kata yang disediakan oleh guru. Kita mungkin sering meminta pembelajar konsisten. Artinya, bahasa harus berisi semua kata untuk . Pelajar menstabilkan jika pelajar menebak untuk bahasa target tidak berubah. Secara khusus, harus ada beberapa indeks sehingga untuk semua , . Pelajar berhasil jika bahasa final sama dengan bahasa target.L ( p ( i ) ) f ( j ) j ≤ i k j ≥ k L ( p ( j ) ) = L ( p ( j + 1 ) )p:N→RepL(p(i))f(j)j≤ikj≥kL(p(j))=L(p(j+1))
Izinkan saya menekankan bahwa ini hanya satu formalisasi spesifik dari satu model pembelajaran tertentu. Tetapi ini adalah langkah nol sebelum Anda dapat mulai bertanya dan mempelajari pertanyaan-pertanyaan yang Anda minati. Model pembelajaran dapat diperkaya dengan memungkinkan interaksi antara pelajar dan guru. Daripada keluarga bahasa yang sewenang-wenang, kita dapat mempertimbangkan bahasa yang sangat spesifik, atau bahkan representasi spesifik (seperti fungsi Boolean monoton). Ada perbedaan antara apa yang dapat Anda pelajari di setiap model dan kompleksitas pembelajaran. Inilah salah satu contoh hasil ketidakmungkinan yang mendasar.
Emas [1967] Tidak satu pun rumpun bahasa yang berisi semua bahasa berhingga dan setidaknya satu bahasa super berhingga dapat dipelajari secara pasif hanya dari data positif.
Seseorang harus sangat berhati-hati dalam menafsirkan hasil ini. Misalnya, Dana Angluin menunjukkan di tahun 80-an itu
Angluin [1982] Kelas bahasa reversibel dapat dipelajari secara pasif dalam batas dari data positif.k
Kelas bahasa reversibel tidak terbatas, berisi bahasa super-terbatas, tetapi yang menarik, tidak mengandung semua bahasa terbatas. Sekarang setelah Anda mengubah model pembelajaran, hasil dasarnya berubah.k
Angluin [1987] Bahasa reguler dapat dipelajari dari seorang guru yang menjawab pertanyaan kesetaraan dan memberikan contoh tandingan. Algoritme adalah polinomial dalam himpunan status DFA minimal dan panjang sampel balik maksimal.
Ini adalah hasil yang cukup kuat dan positif dan baru-baru ini telah menemukan beberapa aplikasi. Namun, seperti biasa detailnya penting, seperti judul makalah di bawah ini sudah menyarankan.
Masalah DFA konsisten minimum tidak dapat diperkirakan dalam dan polinomial
, Pitt dan Warmuth, 1989.
Sekarang Anda mungkin bertanya-tanya, bagaimana semua ini relevan dengan pertanyaan Anda? Jawaban saya adalah bahwa ruang desain untuk definisi matematis masalah Anda sangat besar dan titik spesifik yang Anda pilih dalam ruang ini akan memengaruhi jenis jawaban yang akan Anda dapatkan. Hal di atas tidak dimaksudkan sebagai survei komprehensif tentang bagaimana memformalkan masalah pembelajaran. Itu hanya dimaksudkan untuk menunjukkan arah yang ingin Anda selidiki. Semua referensi dan hasil yang saya kutip sangat tanggal, dan lapangan telah melakukan banyak hal sejak itu. Ada buku teks dasar yang bisa Anda baca untuk mendapatkan latar belakang yang cukup untuk merumuskan pertanyaan Anda secara tepat dan menentukan apakah jawaban yang Anda cari sudah ada.