Pertanyaan yang diberi tag «text-processing»

Manipulasi atau pemeriksaan teks oleh program, skrip, dll.

6
Memfilter utf8 yang tidak valid
Saya memiliki file teks dalam penyandian yang tidak dikenal atau campuran. Saya ingin melihat baris yang berisi urutan byte yang tidak valid UTF-8 (dengan memipipkan file teks ke beberapa program). Setara, saya ingin menyaring baris yang valid UTF-8. Dengan kata lain, saya sedang mencari .grep [notutf8] Solusi ideal adalah portable, …





8
Bagaimana cara mengubah TXT ke PDF?
Saya ingin mengonversi .txtfile menjadi .pdf. Saya menggunakan ini: ls | while read ONELINE; do convert -density 400 "$ONELINE" "$(echo "$ONELINE" | sed 's/.txt/.pdf/g')"; done Tapi ini menghasilkan satu "kesalahan" - jika ada baris yang sangat panjang di file teks, itu tidak bisa dibungkus. Masukkan teks Keluarkan PDF - Selain …

5
Hapus baris terakhir dari file
Saya gunakan sed untuk menghapus baris dengan posisi tertentu dengan cepat sed '1d' sed '5d' Tapi, bagaimana jika saya ingin menghapus baris terakhir file dan saya tidak tahu jumlah baris (saya tahu saya bisa menggunakan itu wcdan beberapa trik lainnya). Saat ini, menggunakan solusi dengan headdan taildikombinasikan dengan wcuntuk melakukannya. …

5
Ganti variabel lingkungan dalam file dengan nilai aktualnya?
Apakah ada cara mudah untuk mengganti / mengevaluasi variabel lingkungan dalam file? Seperti katakanlah saya memiliki file config.xmlyang berisi: <property> <name>instanceId</name> <value>$INSTANCE_ID</value> </property> <property> <name>rootPath</name> <value>/services/$SERVICE_NAME</value> </property> ... dll. Saya ingin mengganti $INSTANCE_IDdalam file dengan nilai INSTANCE_IDvariabel lingkungan, $SERVICE_NAMEdengan nilai SERVICE_NAMEenv var. Saya tidak akan tahu apriori mana vars lingkungan …





4
Grep dari akhir file ke awal
Saya memiliki file dengan sekitar 30.000.000 baris (Radius Accounting) dan saya perlu menemukan kecocokan terakhir dari pola yang diberikan. Perintah: tac accounting.log | grep $pattern memberikan apa yang saya butuhkan, tetapi terlalu lambat karena OS harus terlebih dahulu membaca seluruh file dan kemudian mengirim ke pipa. Jadi, saya butuh sesuatu …


1
Bagaimana membuat tr menyadari karakter non-ascii (unicode)?
Saya mencoba untuk menghapus beberapa karakter dari file (UTF-8). Saya menggunakan truntuk tujuan ini: tr -cs '[[:alpha:][:space:]]' ' ' <testdata.dat File berisi beberapa karakter asing (seperti "Латвийская" atau "àé"). trtampaknya tidak memahaminya: itu memperlakukan mereka sebagai non-alpha dan menghapus juga. Saya telah mencoba mengubah beberapa pengaturan lokal saya: LC_CTYPE=C LC_COLLATE=C …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.