Biner dan data teks tidak terpisah: Mereka hanya data . Itu tergantung pada interpretasi yang membuat mereka satu atau yang lain. Jika Anda membuka data biner (seperti file gambar) dalam editor teks, banyak dari itu tidak masuk akal, karena tidak sesuai dengan interpretasi yang Anda pilih (sebagai teks).
Apa yang Anda sebut teks adalah subset dari konten file yang mungkin: Data yang di set karakter yang diberikan diterjemahkan ke karakter yang dapat dibaca.
Misalnya, dalam ASCII , Anda dapat melihat bahwa, dari 128 nilai yang "diizinkan", hanya sekitar setengahnya berupa huruf dan angka, 30 adalah tanda baca, dan sisanya adalah karakter kontrol . Grup yang terakhir tidak banyak digunakan dalam file teks, dan mereka tidak memiliki representasi tekstual yang benar-benar bagus. Beberapa di antaranya adalah karakter Tab dan Newline , di mana editor teks sudah harus kreatif dalam menampilkannya.
Beberapa editor teks memiliki opsi untuk secara eksplisit menampilkan spasi putih. Kemudian mereka akan benar-benar digambarkan sebagai karakter, di samping perilaku pemformatan reguler mereka (yang juga hanya merupakan interpretasi dari karakter-karakter ini).
ASCII Murni hanya mengartikan 128 nilai. Bytes yang digunakan untuk menyimpan informasi ini masing-masing memiliki 256 nilai yang mungkin, jadi setengah dari nilai yang mungkin tidak diizinkan di ASCII. Itu misalnya digunakan dalam set karakter khusus kawasan, seperti Latin 1, tetapi dalam ASCII, mereka tidak terdefinisi. Mereka tidak memiliki representasi yang berguna dalam penampil teks yang hanya bisa menangani ASCII.
Data biner biasanya tidak diartikan sebagai teks. Jadi dalam file-file ini, semua nilai byte yang mungkin umumnya ditemukan. Segala sesuatu yang lain akan sia-sia (dan itulah alasan Anda dapat mengompresi teks dengan sangat baik). Format file gambar rumit, dan Anda biasanya tidak melihatnya sebagai teks, sehingga tidak perlu dibaca.
Karena tidak ada interpretasi data umum (set karakter) yang memetakan semua nilai yang mungkin untuk karakter yang dapat dibaca, dan karena itu tidak masuk akal juga (karena itu bukan teks yang dapat dibaca), bagian utama ditampilkan sebagai omong kosong.
Editor heksa memilih representasi yang berbeda untuk data: Ini menampilkan setiap byte sebagai dua digit heksadesimal . Ini hanya representasi yang berbeda, dan satu dengan rangkaian karakter yang mudah dibaca oleh manusia: Semua 256 nilai byte yang mungkin dapat direpresentasikan sebagai dua digit hex.
Karena ada pemetaan yang mudah dari data biner ke hex dan sebaliknya (4 digit biner ke / dari satu digit heksadesimal), dan biner berisi sangat sedikit informasi per digit, heksadesimal umumnya merupakan cara yang disukai manusia untuk membaca biner, kecuali ada yang spesifik alasan untuk memilih representasi yang berbeda.
Beberapa editor teks mungkin memiliki mode hex editor dan beberapa heuristik yang mencoba menentukan apakah suatu file adalah teks atau biner, dan secara otomatis memilih satu mode atau yang lain. Tetapi ini bisa sulit untuk dilakukan dengan benar dan itu bukan properti spesifik dari file yang mengatakan apakah itu satu atau lain jenis.
Beberapa klien FTP meminta Anda untuk menentukan ujung file mana yang digunakan untuk data teks . Program-program ini kemudian akan mengubah konten file agar sesuai dengan OS mesin yang terhubung dengan Anda, karena Windows menggunakan urutan karakter akhir baris yang berbeda ( CR/LF
) dari Linux dan Unix (termasuk Mac OS X; LF
).