Plaintext adalah biner.
Ketika Anda menulis sebuah H
ke hard drive, kepala tulis tidak mengukir dua garis vertikal dan garis horizontal ke piring, itu secara magnetis mengkodekan bit 01001000
1 ke dalam piring.
Dari sana, seharusnya jelas bahwa menyimpan data teks biasa memakan jumlah ruang yang persis sama dengan menyimpan data biner.
Tapi plaintext hanyalah satu dari 2 format biner tertentu
Plaintext dapat diubah secara terbalik menjadi format biner lainnya. Salah satu transformasi umum adalah kompresi yang biasanya menghasilkan representasi yang lebih kompak, yang berarti lebih sedikit bit yang digunakan untuk mewakili informasi yang sama.
Bergantung pada apa yang Anda gunakan untuk mewakili plaintext, Anda mungkin dapat menggunakan format biner berbeda untuk mewakili informasi yang sama. Ini mungkin menggunakan lebih banyak ruang, mungkin menggunakan lebih sedikit.
Sebagai contoh, angka-angka 5
dan 1234567
dapat diwakili dalam plaintext menggunakan karakter digit, menghasilkan urutan bit ini pada disk 3 :
00110101 00000000
00110001 00110010 00110011 00110100 00110101 00110110 00110111 00000000
Atau, Anda dapat menggunakan komplemen 32-bit two :
00000000 00000000 00000000 00000101
00000000 00010010 11010110 10000111
Yang merupakan representasi kurang kompak 5
, tetapi representasi lebih kompak 1234567
.
Dan ada jumlah representasi lain yang benar-benar tak terbatas yang akan memiliki tingkat keringkasan, dan fleksibilitas yang beragam, meskipun, dalam praktiknya jauh lebih sedikit daripada banyak representasi yang benar-benar digunakan.
1 Dengan asumsi UTF-8. Urutan bit yang tepat untuk karakter tergantung pada pengkodean spesifik yang Anda gunakan.
2 Atau benar-benar, beberapa format, mengingat berbagai penyandian .
3 Jika Anda bertanya-tanya apa delapan angka nol di ujungnya, yah, Anda perlu cara untuk mengetahui berapa lama data tersebut. Opsi pada dasarnya mendidih ke marker (saya menggunakan ini, melalui byte nol), ruang yang didedikasikan untuk menyimpan panjang (Pascal menggunakan byte untuk menyimpan panjang string), atau ukuran tetap (digunakan dalam komplemen dua berikutnya contoh).