Saya memiliki PC dengan Intel (R) Pentium (R) CPU G640 @ 2.80 GHz dan 8 GB RAM. Saya menjalankan Scientific Linux 6.5 di atasnya dengan sistem file EXT3.
Pada pengaturan ini, apa cara tercepat yang dapat saya lakukan sort -u
pada file 200 gigabyte?
Haruskah saya membagi file menjadi file yang lebih kecil (lebih kecil dari 8 GB), sort -u
menggabungkannya, lalu membaginya lagi dalam ukuran yang berbeda, sort -u
lagi, dll? Atau ada skrip penyortiran, program yang dapat menangani file sebesar ini dengan jumlah RAM yang terbatas?
parallel
untuk ini, saya pikir daripada moreutils parallel
yang diinstal secara default pada beberapa sistem.
sort(1)
bisa kehabisan ruang pada /tmp
; jika demikian, Anda dapat menunjuk area lain untuk file sementara dengan variabel lingkungan TMPDIR
, atau flag-T=<tmpdir>
/tmp
.