Anda dapat menggunakan ekspresi reguler untuk menghapus kata yang digandakan berturut-turut dalam satu baris, namun saya rasa tidak mungkin untuk menghapus kata yang digandakan yang tidak berurutan (mis dangerous, hazardous, dangerous
.).
Gunakan regex ini di jendela ganti di Notepad ++, dan jangan lupa untuk memilih "Ekspresi reguler" sebagai opsi Mode Pencarian di bawah:
Regex ini akan menghapus semua kata digandakan berturut-turut - apakah itu 2 kata digandakan atau 10 kata digandakan berturut-turut: \b(\w+)(?:,\s+\1\b)+
.
Regex no-koma yang sama persis adalah: \b(\w+)(?:\s+\1\b)+
(mungkin berguna untuk pengguna lain).
Jika Anda ingin regex khusus untuk hanya dua kata digandakan (ganda), menggunakan regex ini: (\b\w+\b)\W+\1
.
Tempatkan regex ini di Ganti dengan kotak untuk menjaga satu kejadian dari kata (kata kalau tidak semua diulang akan dihapus): ${1}
.
Ekspresi reguler ini akan memperbaiki situasi seperti yang Anda gambarkan dalam pertanyaan Anda sebagai contoh. Regex pertama akan bekerja untuk setiap jumlah kata yang digandakan (misalnya dangerous, dangerous, dangerous, dangerous, hazardous
), sedangkan versi kedua hanya akan berfungsi untuk dua kata yang digandakan (misalnya dangerous, dangerous, hazardous
).
Catatan: Ekspresi reguler hanya akan berlaku untuk format yang dijelaskan dalam pertanyaan, yang berarti bahwa format suka two words, two words, anotherword
, two-words, two-words, anotherword
, three words expression, three words expression, anotherword
tidak akan berubah karena regex tidak akan berlaku untuk mereka.
dangerous,hazardous,dangerous,perilous
? Dengan kata lain, apakah kata yang digandakan selalu bersebelahan?