Saya sedang mempertimbangkan masalah mengenali bahasa (lebih dari alfabet 0-9 dan spasi) yang mengandung string seperti "1 2 3 4 5 6" dan "14 15 16 17" tetapi tidak "1 3".
Ini muncul saat mengerjakan tugas parsing umum di mana elemen harus ada dalam daftar yang diurutkan. Saya tersadar bahwa ketika mem-parsing sisa bahasa itu adalah biasa, bagian ini jelas tidak teratur - ia dapat mengenali, misalnya, bahasa A1A2 di mana A adalah string acak 0-9. Bahkan tampaknya menjadi konten-sensitif (dan tidak bebas konteks oleh lemma pemompaan).
Pertanyaan pertama saya: adakah kelas bahasa (yang cukup dikenal, yaitu tidak didefinisikan hanya untuk masalah ini) antara peka konteks dan bebas konteks yang menggambarkan kekuatan ekspresifnya dengan lebih baik? Saya sudah membaca tentang bahasa yang diindeks Aho, tetapi tidak jelas (bagi saya!) Bahwa ini bahkan di kelas itu, meskipun kuat.
Pertanyaan kedua saya adalah informal. Tampaknya bahasa ini mudah diurai, namun sangat tinggi dalam hierarki. Apakah biasa menemukan contoh serupa dan apakah ada cara standar untuk menghadapinya? Apakah ada pengelompokan alternatif dari kelas bahasa yang tidak sesuai dengan inklusi pada yang 'biasa'?
Alasan saya untuk berpikir ini mudah: bahasa dapat diuraikan secara deterministik, dengan membaca sampai Anda mencapai akhir nomor pertama, memeriksa apakah nomor berikutnya mengikuti, dan sebagainya. Khususnya dapat diuraikan dalam O (n) waktu dengan O (n) ruang; ruang dapat direduksi menjadi tanpa terlalu banyak kesulitan, saya pikir. Tapi itu cukup sulit untuk mendapatkan kinerja semacam itu dengan bahasa reguler, apalagi bebas konteks.