14
Ganti string dalam file teks berukuran besar (70GB), satu baris
Saya memiliki file teks (70GB), satu baris , dan saya ingin mengganti string (token) di dalamnya. Saya ingin mengganti token <unk>, dengan token dummy lainnya ( masalah sarung tangan ). Saya mencoba sed: sed 's/<unk>/<raw_unk>/g' < corpus.txt > corpus.txt.new tetapi file output corpus.txt.newmemiliki nol-byte! Saya juga mencoba menggunakan perl: perl …