Saya memiliki dokumen teks yang memiliki banyak teks yang memiliki ruang tambahan ditambahkan setelah setiap huruf!
Contoh:
T h e b o o k a l s o h a s a n a n a l y t i c a l p u r p o s e w h i c h i s m o r e i m p o r t a n t…
Secara visual:
T␣h␣e␣␣b␣o␣o␣k␣␣a␣l␣s␣o␣␣h␣a␣s␣␣a␣n␣␣a␣n␣a␣l␣y␣t␣i ␣c␣a␣l␣␣p␣u␣r␣p␣o␣s␣e␣␣w␣h␣i␣c␣h␣␣i␣s␣␣m␣o␣r␣e␣␣i␣ m␣p␣o␣r␣t␣a␣n␣t…
Perhatikan bahwa ada spasi tambahan setelah setiap huruf, jadi ada dua spasi di antara kata-kata yang berurutan.
Apakah ada cara saya bisa mendapatkan awk
atau sed
menghapus ruang ekstra? (Sayangnya dokumen teks ini sangat besar dan akan memakan waktu yang sangat lama untuk dilakukan secara manual.)
Saya menghargai bahwa ini mungkin masalah yang jauh lebih kompleks untuk diselesaikan hanya dengan skrip bash sederhana karena harus ada semacam pengenalan teks juga.
Bagaimana saya bisa mendekati masalah ini?
echo 't h i s i s a n e x a m p l e' | sed 's/ //g'
echo 'T h i s ; i s .a n 9 8 e x a m p l e' | perl -pe 's/[a-z]\K (?=[a-z])//ig'