Sungguh, fakta bahwa file sudah dikompres bukan masalah krusial. Ini adalah ini: kompresi secara umum hanya dapat bekerja jika data memiliki semacam redundansi di dalamnya . Itu praktis selalu terjadi untuk file yang tidak terkompresi - namun, itu tidak selalu jelas apa redundansi itu. Algoritma kompresi tujuan umum sebagian besar menargetkan hal-hal yang jelas dalam file teks: banyak kata muncul tidak hanya sekali tetapi banyak kali dalam bentuk yang identik, mungkin frasa kata dapat dikombinasikan, dll. generalisasi ini untuk apa pun dari daftar nomor telepon yang disandikan ASCII lebih dari puisi Cina ke kode mesin biner, tetapi mereka tidak mungkin bekerja untuk semua jenis data. Secara khusus, file media secara konseptualdata analog , dalam representasi digital yang bising. Itu berarti, sebenarnya tidak ada jenis pengalihan-textfile sama sekali: beberapa motif mungkin berulang, tetapi selalu dengan konfigurasi yang sedikit berbeda dari noise sensor. Itu sebabnya semua format gambar / AV terkompresi menggunakan beberapa transformasi yang dipilih secara cerdik sebagai langkah penyandian pertama mereka, biasanya berdasarkan DCT atau wavelet . Transformasi ini secara kasar memindahkan bagian gambar dan bagian suara ke lokasi yang berbeda, sehingga mereka dapat dipisahkan dan dengan kompresi lossy Anda hanya menyimpan informasi yang Anda anggap paling "penting", yang tidak termasuk suara, sedangkan " informasi yang baik "memiliki banyak redundansi. (Itu bukan cara kerjanya, tapi semacamnya.)
Jika kompresor serba guna menggunakan transformasi ini, efeknya akan menjadi kebalikannya: sebagian besar informasi digital sebenarnya akan salah diklasifikasi sebagai beberapa jenis noise, karena tidak memiliki struktur "halus" yang Anda temukan dalam sinyal analog. Dan setelah kompresi video yang hilang jelas tidak ada kelancaran analog atau perulangan digital dapat ditemukan lagi (jika ya, codec akan menggunakan tahap bzip lain atau sesuatu sendiri!)