[root@server]# awk '!seen[$0]++' out.txt > cleaned
awk: (FILENAME=out.txt FNR=8547098) fatal error: internal error
Aborted
[root@server]#
"" Server "" memiliki: 8 GByte RAM + 16 GByte SWAP, x> 300 GByte ruang kosong, amd64, desktop CPU. Linux Ilmiah 6.6. Tidak ada lagi yang dijalankan untuk membuat LOAD. Awk batal setelah beberapa detik .. out.txt adalah ~ 1,6 GByte. GNU Awk 3.1.7.
Pertanyaan : Bagaimana saya bisa menghapus garis duplikat sambil menjaga urutan garis? Kasus juga penting, misalnya: "A" dan "a" adalah dua baris yang berbeda, harus tetap dipertahankan. Tapi "a" dan "a" adalah duplikat, hanya yang pertama diperlukan.
Jawaban bisa dalam apa saja .. jika awk tidak baik untuk ini .. maka perl / sed .. apa masalahnya?
[root@server]# ulimit -a
core file size (blocks, -c) 0
data seg size (kbytes, -d) unlimited
scheduling priority (-e) 0
file size (blocks, -f) unlimited
pending signals (-i) 61945
max locked memory (kbytes, -l) 99999999
max memory size (kbytes, -m) unlimited
open files (-n) 999999
pipe size (512 bytes, -p) 8
POSIX message queues (bytes, -q) 819200
real-time priority (-r) 0
stack size (kbytes, -s) 99999999
cpu time (seconds, -t) unlimited
max user processes (-u) 61945
virtual memory (kbytes, -v) unlimited
file locks (-x) unlimited
[root@server]#
Pembaruan: Saya mencoba ini pada mesin RHEL, tidak dibatalkan, tetapi saya tidak punya waktu untuk menunggu sampai selesai .. mengapa SL linux berbeda dari RHEL?
Pembaruan: Saya mencoba pada Ubuntu 14 virtual gues .. sejauh ini berhasil! Ini bukan masalah ulimit: mawk 1.3.3
root@asdf-VirtualBox:~# ulimit -a
core file size (blocks, -c) 0
data seg size (kbytes, -d) unlimited
scheduling priority (-e) 0
file size (blocks, -f) unlimited
pending signals (-i) 51331
max locked memory (kbytes, -l) 64
max memory size (kbytes, -m) unlimited
open files (-n) 1024
pipe size (512 bytes, -p) 8
POSIX message queues (bytes, -q) 819200
real-time priority (-r) 0
stack size (kbytes, -s) 8192
cpu time (seconds, -t) unlimited
max user processes (-u) 51331
virtual memory (kbytes, -v) unlimited
file locks (-x) unlimited
root@asdf-VirtualBox:~#
awk
versi dalam dua mesin?
out.txt
? Apakah perintah yang sama berfungsi jika Anda mencobanya pada file yang lebih kecil? Berapa banyak pengguna di mesin? Apakah ada cukup memori yang tersedia untuk proses ini? Apakah ada yang spesial tentang baris 8547098 dari file input?