Mengapa ada karakter lebar tetap terpisah untuk 0-9 dalam bahasa Jepang, dibandingkan dengan tipikal 0-9?


9

Jepang (日本語) -0123456789

ASCII khas untuk tempat lain - 0 1 2 3 4 5 6 7 8 9

Mengapa ada kebutuhan untuk membuat set karakter terpisah untuk angka yang sama?

Jawaban:


11

Ini adalah karakter fullwidth .

  • Karakter-karakter ini, yang berada di Unicode U + FF00 hingga U + FFEF, dimaksudkan untuk digunakan dengan karakter CJK. Mereka ada sehingga karakter Latin dapat sejajar dengan teks CJK dengan lebar tetap. Secara historis, karakter Han ditetapkan lebar dua kali lipat dalam terminal 80x24, dan karakter ini digunakan untuk mencocokkan lebar teks CJK.

  • Karakter-karakter ini tidak terbatas pada angka. Alfabet Latin lengkap tersedia dalam bentuk bandwidth penuh.

    ABCDEFGHIJKLMNOPQRSTUVWXYZ
    abcdefghijklmnopqrstuvwxyz
    0123456789
    

Command prompt di Windows menampilkan formulir fullwidth untuk karakter Latin bersama karakter Han
Sumber gambar


3

Karakter-karakter fullwidth tersebut tidak hanya untuk bahasa Jepang tetapi juga untuk bahasa Korea dan Cina karena mereka memiliki set karakter lebar-ganda (alias fullwidth). Karena kompleksitas visual dan resolusi layar yang buruk di masa lalu, tidak mungkin secara fisik untuk menampilkan bahasa tersebut dalam karakter setengah lebar - terutama untuk karakter Korea dan Cina.

(Bahasa Jepang memiliki karakter setengah lebar juga, tetapi dalam bahasa Jepang, agak jarang menggunakan karakter Jepang saja. Sebagian besar datang dengan karakter Cina campuran. Jadi memiliki karakter setengah lebar tidak banyak membantu.)

Karakter numerik berukuran besar itu diperkenalkan untuk itu. Ketika mereka menulis, misalnya, tabel atau teks gaya grid tanpa menggunakan grafik, karakter numerik yang khas tidak tercampur dengan baik. Selain itu, mereka memiliki budaya "penulisan vertikal" serta tulisan horizontal yang kita gunakan sekarang. Bayangkan saja, jika Anda menulis karakter tersebut secara vertikal, karakter numerik konvensional mungkin akan terlihat jelek ketika dicampur.

Hal serupa juga terjadi di sisi struktur data karena karakter setengah lebar masing-masing mengambil 1 byte, sedangkan karakter bandwidth penuh melakukan 2 byte atau lebih.

Membuat sebagian besar karakter menggunakan ruang yang sama & memori membuat banyak hal seperti ini lebih sederhana. Demikian juga, ada karakter Romawi fullwidth juga.

Saya agak mengerti mengapa Anda mengajukan pertanyaan ini - saat ini, semuanya ada di GUI. Tabel tidak lagi ditulis dalam teks. Tulisan-tulisan vertikal menjadi usang. Untuk memiliki karakter yang lebih luas, kita cukup menyesuaikan lebar daripada menggunakan karakter yang gemuk. Sebagian besar karakter mengambil banyak byte karena pengkodean yang lebih kompleks diperkenalkan. Jadi mungkin memang benar bahwa karakter alfanumerik fullwidth itu adalah semacam warisan dari masa lalu seperti kunci "Scroll Lock" pada keyboard Anda.


0

Saya percaya itu ada hubungannya dengan lebar karakter dan bahasa Jepang adalah salah satu bahasa di mana Anda dapat mengetik secara vertikal.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.