Saya harus mengekstrak kolom data dari file yang sangat besar> 100GB.
Saya tahu cara menggunakan awk
dan cut
perintah melakukannya, tetapi ingin tahu apakah ada yang lebih efisien (dari perspektif kecepatan) untuk tugas seperti itu.
Jika
—
Michael Vehrs
cut
dapat digunakan, itu harus lebih cepat, karena jauh lebih sederhana, dan dengan demikian kurang mampu.
grep -o "\w*pattern\w*" /path/to/file
. Anda mungkin ingin membaca juga tentangparallel
menggunakan beberapagrep
pada potongan file itu.