Saya melihat pertanyaan ini pada proposal situs Tipografi dan saya tersinggung bahwa saya tidak tahu jawabannya. Saya selalu memperlakukan 'mesin terbang' dan 'karakter' sebagai hal yang dapat dipertukarkan.
Setelah membaca penjelasan pada halaman Unicode Character Encoding Model , pemahaman saya kira-kira seperti ini:
- Karakter didefinisikan oleh maknanya dalam bahasa, mesin terbang, oleh penampilan mereka . Jadi, ligatur untuk menggabungkan estetika
fi
adalah satu mesin terbang, tetapi dua karakter.
Jadi, kepercayaan saya adalah (tolong perbaiki saya jika saya salah) bahwa perbedaan praktisnya adalah:
- Pengurai teks yang tidak tertarik pada estetika teks akan membaca mesin terbang sebagai karakter masing-masing. Begitu:
- Jika Anda menyalin dan menempelkan teks yang mengandung mesin terbang ke editor teks biasa, mesin terbang akan dikonversi ke karakter masing-masing (
fi
mesin pengikat ligatur akan menjadif
dani
) - Setiap sistem otomatis yang dibuat dengan baik berdasarkan penguraian teks (misalnya crawler mesin pencari, pembaca layar, pemeriksa ejaan) akan menafsirkan mesin terbang sebagai karakter masing-masing.
- Satu karakter dapat memiliki banyak mesin terbang atau mesin terbang. Saya ingin mengatakan satu mesin terbang hanya dapat memiliki satu karakter, tetapi ini jelas tidak benar karena ada contoh pada artikel terkait 3 mesin terbang dan mesin terbang yang tampaknya masing-masing sesuai dengan karakter dan serangkaian karakter. Saya tidak begitu mengerti bagaimana ini bisa bekerja: pasti itu berarti akan ada ketidakkonsistenan atau ambiguitas dalam bagaimana mesin terbang itu ditafsirkan, berbeda menurut penafsir? (atau apakah itu berbeda menurut bahasa, atau menurut font?)
- Sementara peramban mesin terbang (misalnya yang ada di Illustrator) berisi kumpulan mesin terbang penuh font, peta karakter (misalnya peta karakter Windows) hanya berisi karakter, bukan mesin terbang yang banyak karakter seperti ligatur (sesuatu yang saya tidak perhatikan sebelumnya)
- Jika Anda menyalin dan menempelkan teks yang mengandung mesin terbang ke editor teks biasa, mesin terbang akan dikonversi ke karakter masing-masing (
Saya merasa seperti hampir sampai di sana, tetapi saya telah salah memahami sesuatu di suatu tempat di sepanjang garis: bukan hanya hal "Satu karakter ganda", tetapi juga, perilaku menyalin dan menempel dengan pengikat tidak cukup seperti yang saya harapkan:
- Salin ligatur
fi
dari Illustrator ke kotak input ini: pasta sebagaifi
(dua karakter) seperti yang diharapkan. - Tempel di kode HTML untuk itu (
fi
) - ditampilkan sebagai ligatur ketika tidak ada dalam blok kode (fi - yang dalam font ini tidak terlihat seperti ligatur, tetapi Anda akan melihat salah satunya jika Anda mencoba memilih hanya setengah itu), dan kode ketika dalam blok kode (fi
), seperti yang diharapkan. - Salin dan tempel ligatur non-kode-blok yang diberikan kembali ke kotak input: paste sebagai karakter ligatur, dan render sebagai ligatur terlepas dari apakah itu dalam blok kode atau tidak (fi dan
fi
). Demikian juga kata-kata yang berisi itu: pas mis ( tsfit misfits
) paste sebagai pas mis ( tsfit misfits
). Mungkin itu tergantung pada apakah tempat itu disisipkan memahami pengkodean yang digunakan?
Seberapa jauh pemahaman saya tentang ini? Adakah yang bisa membuat saya benar: menyatakan definisi yang jelas tentang perbedaan antara mesin terbang dan karakter (jika milik saya salah atau dapat ditingkatkan), dan memberikan contoh yang lebih jelas / lebih akurat daripada milik saya tentang apa artinya itu dalam praktik ?