TLDR
Pertanyaan aslinya tidak jelas, dan membaca bahwa OP hanya menginginkan versi unik dari isi file. Itu ditunjukkan di bawah ini. Dalam bentuk pertanyaan sejak diperbarui, OP sekarang menyatakan bahwa ia hanya ingin tahu apakah isi file itu unik atau tidak.
Uji apakah konten file unik atau tidak
Anda cukup menggunakan sortuntuk memverifikasi apakah file itu unik atau mengandung duplikat seperti:
$ sort -uC input.txt && echo "unique" || echo "duplicates"
Contoh
Katakanlah saya punya dua file ini:
file sampel duplikat
$ cat dup_input.txt
This is a thread 139737522087680
This is a thread 139737513694976
This is a thread 139737505302272
This is a thread 139737312270080
This is a thread 139737203164928
This is a thread 139737194772224
This is a thread 139737186379520
file sampel unik
$ cat uniq_input.txt
A
B
C
D
Sekarang ketika kami menganalisis file-file ini, kami dapat mengetahui apakah mereka unik atau mengandung duplikat:
uji duplikat file
$ sort -uC dup_input.txt && echo "unique" || echo "duplicates"
duplicates
uji file unik
$ sort -uC uniq_input.txt && echo "unique" || echo "duplicates"
unique
Pertanyaan asli (konten unik file)
Dapat dilakukan hanya dengan sort:
$ sort -u input.txt
This is a thread 139737186379520
This is a thread 139737194772224
This is a thread 139737203164928
This is a thread 139737312270080
This is a thread 139737505302272
This is a thread 139737513694976
This is a thread 139737522087680