Dalam bahasa Arab seperti dengan beberapa bahasa lain ada yang disebut diakritik untuk meningkatkan pengucapan. Tidak ada konvensi tentang berapa banyak diakritik harus ditulis untuk satu kata. Beberapa menggunakan minimum (yang saya sukai) hanya cukup untuk mengacaukan pengucapan, sedangkan beberapa menggunakannya secara berlebihan atau hanya untuk tujuan kaligrafi estetika. Dengan demikian, ada variasi yang luas tentang apa dan berapa banyak diakritik terkait dengan satu kata. Ketika saya lakukan isearch-forward/backward
dengan menekan C-s/r
, masalah muncul ketika saya mengetiknya di mini-buffer pencarian tanpa diakritik itu tidak akan cocok dengan kata yang sama dalam teks jika diakritik, membuat tugas mencari kata ini dengan potensi diakritik yang pernah tidak memuaskan.
Apakah ada cara untuk membuat pencarian / pencarian regexp tidak menyadari diakritik? Saya berharap akan ada jawaban yang dapat diperluas untuk memasukkan regexp C-M-s/r
dan grep
mencari yang saya gunakan cukup sering di helm-proyektil untuk mencari kata dalam proyek lateks multi-file.
Perbarui
Akan menyenangkan untuk melihat bahwa Emacs di semua fungsi pencariannya melakukan langkah pengupasan pada teks (dari aksen / diakritik / beri nama) sebelum mencocokkan langkah sebagai perilaku default yang mungkin dimatikan oleh awalan saat diminta tidak peduli apa bahasa yang ada. Biasanya, ketika saya mencari sesuatu yang saya tidak harapkan dari editor terbaik (Emacs) gagal dalam tugas ini hanya karena beberapa diakritik atau aksen yang jarang jika pernah diperlukan untuk menyelesaikan tugas-tugas teks biasa.
php
diterapkan: stackoverflow.com/a/25563250/1288722 - juga diterapkan di Javascript
: stackoverflow.com/a/7193622/1288722
helm-swoop
?
ucs-normalize-*
fungsi dilisp/international/ucs-normalize.el
. Tidak ada lipat pencarian yang telah ditentukan sebelumnya untuk mereka, seperti ada dengan lipat kasus, tetapi Anda setidaknya bisa menormalkan suatu wilayah sebelum mencarinya. Implementasi yang baik mungkin merupakan tugas yang cukup kompleks.