Pertanyaan yang diberi tag «text-processing»

Manipulasi atau pemeriksaan teks oleh program, skrip, dll.


5
Hapus garis duplikat sambil menjaga urutan garis
[root@server]# awk '!seen[$0]++' out.txt > cleaned awk: (FILENAME=out.txt FNR=8547098) fatal error: internal error Aborted [root@server]# "" Server "" memiliki: 8 GByte RAM + 16 GByte SWAP, x> 300 GByte ruang kosong, amd64, desktop CPU. Linux Ilmiah 6.6. Tidak ada lagi yang dijalankan untuk membuat LOAD. Awk batal setelah beberapa detik …


3
pola pertandingan sed N kali
Saya ingin membagi file menjadi potongan-potongan dengan 2 kata masing-masing. $cat tmp word1 word2 word3 word4 word5 word6 word7 $sed -e 's/word. word. /&\n/g' tmp word1 word2 word3 word4 word5 word6 word7 $sed -e 's/word. \{2\}/&\n/g' tmp word1 word2 word3 word4 word5 word6 word7 Saya mengharapkan perintah terakhir untuk memberikan …

5
Penggantian pola pencocokan case dengan sed
Saya memiliki kode sumber yang tersebar di beberapa file. Ini memiliki pola abcdefyang harus saya ganti pqrstuvxyz. Polanya bisa Abcdef(Kasus Kalimat) maka perlu diganti Pqrstuvxyz. Polanya bisa AbCdEf(Toggle case) maka perlu diganti PqRsTuVxYz. Singkatnya, saya harus mencocokkan kasus pola sumber dan menerapkan pola tujuan yang sesuai. Bagaimana saya bisa mencapai …

2
Mengapa perintah xargs ini tidak berfungsi?
Saya ingin menghapus semua ekstensi .sh jadi ini: ls *.sh | xargs -I {} mv {} `basename {} .sh` Namun tidak berfungsi, berperilaku seperti basenamemengembalikan nama file yang tidak berubah. Mengapa berperilaku seperti itu? Misalnya, ini berfungsi: ls *.sh | xargs -I {} echo `basename {}.jpg .jpg`; EDIT : Solusi: …



7
Periksa apakah semua baris file terjadi di file yang berbeda
Saya mendapat dua file: file1 dengan sekitar 10.000 baris dan file2 dengan beberapa ratus baris. Saya ingin memeriksa apakah semua baris file2 terjadi di file1. Yaitu: ∀ baris ℓ ∈ file2: ℓ ∈ file1 Jika ada yang tidak tahu apa arti simbol-simbol ini atau apa yang "memeriksa apakah semua baris …



4
Keluarkan bagian dari setiap baris ke file terpisah
Saya punya file seperti ini: a AGTACTTCCAGGAACGGTGCACTCTCC b ATGGATTTTTGGAGCAGGGAGATGGAATAGGAGCATGCTCCAT c ATATTAAATGGATTTTTGGAGCAGGGAGATGGAATAGGAGCATGCTCCATCCACTCCACAC d ATCAGTTTAATATCTGATACGTCCTCTATCCGAGGACAATATATTAAATGGA e TTTGGCTAAGATCAAGTGTAGTATCTGTTCTTATAAGTTTAATATCTGATATGTCCTCTATCTGA Saya ingin membuat file a.seqyang berisi urutan AGTACTTCCAGGAACGGTGCACTCTCC. Demikian pula b.seqmengandung ATGGATTTTTGGAGCAGGGAGATGGAATAGGAGCATGCTCCAT. Singkatnya, Column1 harus digunakan sebagai nama file output dengan ekstensi .seqdan kemudian harus memiliki urutan kolom2 yang sesuai di dalamnya. Saya dapat melakukan …

2
iconv urutan input ilegal- mengapa?
Ketika mencoba untuk mengkonversi file teks ke ASCII yang setara, saya mendapatkan pesan kesalahan itu iconv: illegal input sequence at position. Perintah yang saya gunakan adalah iconv -f UTF-8 -t ascii//TRANSLIT file Karakter yang menyinggung adalah æ. File teks itu sendiri ada di sini . Mengapa dikatakan urutan ilegal? Karakter …

2
Apa persamaan python dari grep -v?
Saya suka grep -v. Saya menggunakannya sepanjang waktu. Tetapi saya juga melakukan beberapa pemrosesan teks dengan python, dan ada satu hal penting yang saya kekurangan. Biasanya, saya menggunakan grep -vuntuk mengambil hal-hal asing dari teks. Contohnya, $ grep -v '[a-z]' # (I manually review this output to confirm that I …


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.