Setidaknya ada empat pekerjaan terpisah yang sering membingungkan karena alat-alat populer mengintegrasikannya:
- Pengarsipan: kemampuan untuk menggabungkan beberapa file (termasuk metadata) ke dalam satu file, menjaga sebanyak mungkin hal. Di dunia Linux / Unix, pengarsipan secara tradisional dilakukan dalam format file TAR.
- Kompresi: kemampuan untuk meminimalkan lossless ukuran aliran data biner. Di dunia Linux / Unix, ini secara tradisional dilakukan oleh GZip dan BZip2.
- Enkripsi: kemampuan untuk mengacak data dengan kunci
- Checksum: kemampuan untuk mendeteksi (dan mungkin memperbaiki) kesalahan.
Di mana-mana .tar.gz dan .tar.bz berkorespondensi dengan filosofi Unix tentang alat kecil yang melakukan satu pekerjaan dengan baik, di atas satu alat yang melakukan segalanya. Format file TAR tidak mendukung kompresi atau enkripsi, tetapi dapat dikompresi lebih lanjut oleh kompresor apa pun (termasuk sebagai .tar.zip atau .tar.7z). Pekerjaan GZip dan BZip2 hanya untuk mengompres aliran file ke streaming file lain, lapisan kompresi tidak perlu peduli bagaimana mempertahankan metadata atau enkripsi atau checksum. Namun seiring berjalannya waktu, beberapa pintasan telah dibuat dalam tar
program untuk bekerja dengan kompresor lebih nyaman.
Dalam format file zip dan 7z, pekerjaan terpisah ini dilakukan oleh satu program dalam format file super tunggal.
Mengapa tren di atas tampak bertahan, meskipun semua ini adalah format portabel? Apakah ada keuntungan khusus untuk menggunakan format arsip tertentu pada platform tertentu?
Karena sudah seperti itu dilakukan, kode sumber program secara tradisional didistribusikan sebagai .tar.gz atau .tar.bz2, karena menjaga izin file, waktu modifikasi, dll penting untuk berbagai alat yang digunakan untuk pemrograman (misalnya membuat).
Langkah pengarsipan dan kompresi yang terpisah telah bekerja selama bertahun-tahun dengan sangat baik, memiliki keuntungan yang jelas karena dapat secara bebas mencampur dan mencocokkan pengarsipan dan kompresi, dan kelemahannya (proses kompresi 2 langkah) dapat dengan mudah dielakkan dengan mengembangkan alat yang lebih pintar ( sebagian besar program kompresi linux modern akan langsung dikompres ke .tar.gz atau .tar.bz2, menyembunyikan langkah perantara).
Tidak ada alasan kuat untuk pindah ke format file lain, kompresor yang lebih baru tidak memiliki tingkat kompresi yang jauh lebih baik untuk membenarkan melanggar tradisi dan tar dapat mempertahankan semuanya dengan cukup baik.