Saya pergi ke lubang kelinci setelah jawaban yang lain gagal, dan berhasil mengetahui bahwa versi tar saya (1.27.1 dari repo openSUSE 42.3 OSS) menggunakan pax
format arsip non-deterministik secara default, yang berarti bahwa bahkan tanpa kompresi, (dan bahkan mengatur mtime secara eksplisit) arsip yang dibuat dengan tar dari file yang sama akan berbeda:
$ echo hi > test.file
$ tar --create --to-stdout test.file # long form of `tar cO test.file`
./PaxHeaders.13067/test.file0000644000000000000000000000013213427447703012603 xustar0030 mtime=1549684675.835011178
30 atime=1549684726.410510251
30 ctime=1549684675.835011178
test.file0000644000175000001440000000000313427447703013057 0ustar00hartusers00000000000000hi
$ tar --create --to-stdout test.file
./PaxHeaders.13096/test.file0000644000000000000000000000013213427447703012605 xustar0030 mtime=1549684675.835011178
30 atime=1549684726.410510251
30 ctime=1549684675.835011178
test.file0000644000175000001440000000000313427447703013057 0ustar00hartusers00000000000000hi
Perhatikan bahwa output di atas berbeda, meskipun tidak ada kompresi yang digunakan ; konten arsip yang tidak dikompres (dihasilkan dengan menjalankan tar dua kali pada konten yang sama) berbeda, sehingga konten yang dikompresi juga akan berbeda bahkan ketika menggunakan GZIP=-n
seperti jawaban lain menyarankan
Untuk menyiasatinya, Anda dapat menentukan --format gnu
:
$ tar --create --format gnu --to-stdout test.file
test.file0000644000175000001440000000000313427447703011557 0ustar hartusershi
$ tar --create --format gnu --to-stdout test.file
test.file0000644000175000001440000000000313427447703011557 0ustar hartusershi
Ini berfungsi dengan saran tentang gzip di atas:
# gzip refuses to write to stdout, so we'll use the `-f` option to create a file
$ GZIP=-n tar --format gnu -czf test.file.tgz test.file && md5sum test.file.tgz
0d8c7b3bdbe8066b516e3d3af60ade75 test.file.tgz
$ GZIP=-n tar --format gnu -czf test.file.tgz test.file && md5sum test.file.tgz
0d8c7b3bdbe8066b516e3d3af60ade75 test.file.tgz
# without GZIP=-n we see a different hash
$ tar --format gnu -czf test.file.tgz test.file && md5sum test.file.tgz
682ce0c8267b90f4103b4c29903c5a8d test.file.tgz
Namun, selain alasan yang sah untuk lebih memilih format kompresi yang lebih baik daripada gzip , Anda mungkin ingin mempertimbangkan untuk menggunakan xz sebagai gantinya (yang tar juga mendukung dengan --xz
atau -J
tanda bukannya -z
), karena itu menghemat langkah Anda di sini; perilaku default xz
adalah untuk menghasilkan output terkompresi yang sama ketika konten terkompresi adalah sama, sehingga tidak perlu menentukan opsi seperti GZIP=-n
:
$ tar --format gnu --xz -cf test.file.txz test.file && md5sum test.file.txz
dea99037d4b0ee4565b3639e93ac0930 test.file.txz
$ tar --format gnu --xz -cf test.file.txz test.file && md5sum test.file.txz
dea99037d4b0ee4565b3639e93ac0930 test.file.txz
touch filename
yang mengubah waktu file yang diubah sudah cukup untuk mengubah checksum.