Sementara saya setuju bahwa secara teori grep
harus lebih cepat daripada awk
, dalam praktiknya, YMMV karena itu sangat tergantung pada implementasi yang Anda gunakan.
di sini membandingkan busybox 1.20.0 grep dan awk, GNU grep 2.14, mawk 1.3.3, GNU awk 4.0.1 pada Debian / Linux 7.0 amd64 (dengan glibc 2.17) di lokal UTF-8 pada file 240MB dari file 2.5MB dari baris 2.5M dari Hanya karakter ASCII.
$ time busybox grep error error | wc -l
331003
busybox grep error error 8.31s user 0.12s system 99% cpu 8.450 total
wc -l 0.07s user 0.11s system 2% cpu 8.448 total
$ time busybox awk /error/ error | wc -l
331003
busybox awk /error/ error 2.39s user 0.84s system 98% cpu 3.265 total
wc -l 0.12s user 1.23s system 41% cpu 3.264 total
$ time grep error error | wc -l
331003
grep error error 0.80s user 0.10s system 99% cpu 0.914 total
wc -l 0.00s user 0.11s system 12% cpu 0.913 total
$ time mawk /error/ error | wc -l
330803
mawk /error/ error 0.54s user 0.13s system 91% cpu 0.732 total
wc -l 0.03s user 0.08s system 14% cpu 0.731 total
$ time gawk /error/ error | wc -l
331003
gawk /error/ error 1.37s user 0.12s system 99% cpu 1.494 total
wc -l 0.04s user 0.07s system 7% cpu 1.492 total
$ time
Di lokal C, hanya grep GNU yang mendapat dorongan signifikan dan menjadi lebih cepat dari mawk
.
Dataset, jenis regexp juga dapat membuat perbedaan besar. Untuk regexps, awk
harus dibandingkan dengan grep -E
sebagai awk
regexps 's yang Res diperpanjang.
Untuk dataset ini, awk
bisa lebih cepat daripada grep
pada sistem berbasis busybox atau sistem di mana mawk
default awk
dan lokal default adalah berbasis UTF-8 (IIRC, dulu di Ubuntu).
time
perintah untuk menentukan waktu berapa lama untuk menjalankan perintah. Ex:time ls -l
.