Apakah ada perintah Linux yang dapat digunakan untuk sampel subset file? Misalnya, file berisi satu juta baris, dan kami ingin mengambil sampel acak hanya seribu baris dari file itu.
Secara acak saya maksudkan bahwa setiap baris mendapatkan probabilitas yang sama untuk dipilih dan tidak ada baris yang dipilih yang berulang.
head
dan tail
dapat memilih subset file tetapi tidak secara acak. Saya tahu saya selalu bisa menulis skrip python untuk melakukannya tetapi hanya ingin tahu apakah ada perintah untuk penggunaan ini.