Untuk memulai dengan dasar-dasar, semuanya didasarkan pada US-ASCII yang merupakan kode 7 bit dengan 128 titik kode di set, bernomor hex 00 hingga 7F atau desimal 0-127. Ini dipetakan untuk mengontrol kode, alfanumerik bahasa Inggris, dan karakter tanda baca dasar
Menambahkan 1 bit ke ini untuk kode 8 bit (byte) memberi kita 128 poin kode lain atau ASCII Diperpanjang.
Halaman himpunan karakter / kode diperlukan sejak awal untuk mengubah bagaimana kode poin di 128 bit dipetakan ke karakter untuk menutupi alfabet untuk bahasa tertentu yang ingin Anda wakili. Ini bekerja cukup baik untuk sebagian besar bahasa Eropa barat. ISO 8859-1 / Latin-1 adalah contoh dari rangkaian karakter tersebut. Lain adalah Windows-1252 yang memiliki perubahan dari ISO 8859-1 untuk membantunya mencakup lebih banyak karakter atau berbeda.
Bahasa dengan set karakter yang lebih kompleks seperti Cina, Jepang, dan Korea melebihi kemampuan set point kode 256 dan menggunakan kode byte ganda untuk memungkinkan representasi mereka.
Unicode UTF-8 adalah skema pengkodean karakter multi-byte (1-4 byte) dengan kompatibilitas mundur ke ISO 8859-1 / Latin-1 menjadi 128 karakter pertamanya. Ini memiliki ruang untuk lebih dari 1 juta titik kode yang berarti bahwa setiap titik kode dapat benar-benar mewakili karakter, tidak seperti penyimpangan yang dilakukan dengan Extended ASCII yang berarti bahwa titik kode memetakan ke karakter yang berbeda, tergantung pada set karakter / halaman kode / pengkodean.
Font adalah mesin terbang yang dipetakan ke titik kode dan secara visual mewakili karakter. Isi font tergantung pada bahasa apa yang semula dimaksudkan untuk dibahas. Anda dapat menggunakan Character Map untuk melihat mesin terbang apa yang terkandung dalam font.
Font Unicode tidak selalu mencakup semua poin kode, Anda harus melihat di mana mereka dimaksudkan untuk digunakan. Misalnya, di Windows 7, aktifkan Character Map dan lihat karakter di Calibri dan kemudian bandingkan dengan Ebrima, Meiryo dan Raavi. Perhatikan bahwa mereka sangat berbeda karena masing-masing dirancang untuk wilayah geografis yang berbeda.
Untuk font Unicode dan rangkaian karakter Windows-1252, Windows menggunakan tabel pemetaan untuk menerjemahkan Windows-1252 ke Unicode di mana ia tidak cocok dengan ISO 8859-1 untuk skenario "Paling Sesuai" di mana beberapa karakter dalam karakter Windows-1252 set mungkin tidak ditampilkan.