Banyak dari kita perlu berurusan dengan input pengguna, permintaan pencarian, dan situasi di mana teks input berpotensi mengandung kata-kata kotor atau bahasa yang tidak diinginkan. Seringkali ini perlu disaring.
Di mana orang dapat menemukan daftar kata-kata umpatan yang baik dalam berbagai bahasa dan dialek?
Apakah ada API yang tersedia untuk sumber yang berisi daftar bagus? Atau mungkin API yang hanya mengatakan "ya ini bersih" atau "tidak ini kotor" dengan beberapa parameter?
Apa saja metode yang bagus untuk menangkap orang yang mencoba menipu sistem, seperti $$, azz, atau a55?
Poin bonus jika Anda menawarkan solusi untuk PHP. :)
Sunting: Respons terhadap jawaban yang mengatakan cukup hindari masalah program:
Saya pikir ada tempat untuk filter semacam ini ketika, misalnya, pengguna dapat menggunakan pencarian gambar publik untuk menemukan gambar yang ditambahkan ke kumpulan komunitas yang sensitif. Jika mereka dapat mencari "penis", maka mereka kemungkinan akan mendapatkan banyak gambar, ya. Jika kita tidak menginginkan foto-foto itu, maka mencegah kata sebagai istilah pencarian adalah penjaga gerbang yang baik, meskipun diakui bukan metode yang mudah. Mendapatkan daftar kata di tempat pertama adalah pertanyaan sebenarnya.
Jadi saya benar-benar merujuk pada cara untuk mengetahui token tunggal yang kotor atau tidak dan kemudian tidak mengizinkannya. Saya tidak akan repot mencegah sentimen seperti referensi "jerapah berleher panjang" yang benar-benar lucu. Tidak ada yang bisa Anda lakukan di sana. :)