Rekayasa Perangkat Lunak utf-8

1

Apakah penggunaan "utf8 = ✓" lebih baik daripada "utf8 = true"?

Saya baru-baru ini melihat beberapa URI yang berisi parameter kueri "utf8 = ✓". Kesan pertama saya (setelah berpikir "mmm, terlihat keren") adalah ini dapat digunakan untuk mendeteksi pengkodean karakter yang rusak. Jadi, apakah ini cara yang lebih baik untuk menyelesaikan masalah potensial dengan pengkodean karakter, atau hanya pengembang yang bersenang-senang …

569 validation http-request utf-8

2

Bagaimana cara mendeteksi penyandian file?

Pada sistem file saya (Windows 7) saya memiliki beberapa file teks (Ini adalah file skrip SQL, jika itu penting). Ketika dibuka dengan Notepad ++ , di menu "Encoding" beberapa dari mereka dilaporkan memiliki encoding "UCS-2 Little Endian" dan beberapa "UTF-8 tanpa BOM". Apa bedanya di sini? Semua itu tampaknya merupakan …

115 file-systems character-encoding utf-8 notepad++

5

Apa keuntungan memilih pengkodean ASCII dari pada UTF-8?

Semua karakter dalam ASCII dapat dikodekan menggunakan UTF-8 tanpa peningkatan penyimpanan (keduanya membutuhkan byte penyimpanan). UTF-8 memiliki manfaat tambahan dukungan karakter di luar "ASCII-karakter". Jika itu yang terjadi, mengapa akan kita pernah memilih ASCII encoding lebih UTF-8? Apakah ada use case ketika kita akan memilih ASCII bukan UTF-8?

91 character-encoding utf-8 ascii

5

Apakah UTF-8 dapat mendukung masuknya bahasa asing yang luas dengan jutaan karakter baru?

Jika invasi alien terjadi dan kami dipaksa untuk mendukung bahasa mereka di semua sistem komputer kami yang ada, apakah UTF-8 dirancang sedemikian rupa untuk memungkinkan sejumlah besar karakter mereka? (Tentu saja, kita tidak tahu apakah alien benar-benar memiliki bahasa, jika atau bagaimana mereka berkomunikasi, tetapi demi argumen, tolong bayangkan mereka …

86 unicode utf-8

6

Haruskah Latin-1 digunakan lebih dari UTF-8 ketika datang ke konfigurasi database?

Kami menggunakan MySQL di perusahaan tempat saya bekerja, dan kami membangun aplikasi internal yang menghadap ke klien dan menggunakan Ruby on Rails. Ketika saya mulai bekerja di sini, saya mengalami masalah yang belum pernah saya temui sebelumnya; database pada server produksi diatur ke Latin-1, yang berarti bahwa permata MySQL melempar …

65 database mysql ruby-on-rails utf-8 ascii

8

Haruskah penyandian karakter selain UTF-8 (dan mungkin UTF-16 / UTF-32) dihentikan?

Kencing hewan peliharaan saya sedang melihat begitu banyak proyek perangkat lunak yang memiliki banyak kode untuk dukungan set karakter. Jangan salah paham, saya semua mendukung kompatibilitas, dan saya senang editor teks membiarkan Anda membuka dan menyimpan file dalam beberapa set karakter. Yang mengganggu saya adalah bagaimana proliferasi pengkodean karakter non-universal …

31 unicode utf-8 character-encoding

4

Mengapa UTF-8 membuang beberapa bit dalam pengkodeannya

Menurut artikel Wikipedia , UTF-8 memiliki format ini: Kode pertama Kode terakhir Bytes Byte 1 Byte 2 Byte 3 Byte 4 point point Digunakan U + 0000 U + 007F 1 0xxxxxxx U + 0080 U + 07FF 2 110xxxxx 10xxxxxx U + 0800 U + FFFF 3 1110xxxx 10xxxxxx …

17 character-encoding utf-8 text-encoding

2

Apakah UTF-16 memiliki lebar tetap atau lebar variabel? Mengapa UTF-8 tidak memiliki masalah byte-order?

Apakah UTF-16 memiliki lebar tetap atau lebar variabel? Saya mendapat hasil berbeda dari sumber berbeda: Dari http://www.tbray.org/ongoing/When/200x/2003/04/26/UTF : UTF-16 menyimpan karakter Unicode dalam potongan enam belas-bit. Dari http://en.wikipedia.org/wiki/UTF-16/UCS-2 : UTF-16 (16-bit Unicode Transformation Format) adalah pengkodean karakter untuk Unicode yang mampu mengkodekan angka 1.112.064 [1] (disebut titik kode) dalam ruang …

16 unicode character-encoding utf-8

3

Haruskah kode sumber saya berada di UTF-8?

Saya merasa bahwa Anda sering tidak benar-benar memilih format apa kode Anda. Maksudku sebagian besar alat saya di masa lalu telah memutuskan untuk saya. Atau saya bahkan belum memikirkannya. Saya menggunakan TextPad di windows tempo hari dan ketika saya sedang menyimpan file, itu mendorong saya tentang ASCII, UTF-8/16, Unicode dll …

10 coding-standards source-code character-encoding utf-8

1

Apakah kategori iterator C ++ melarang penulisan adaptor iterator UTF-8?

Saya telah mengerjakan adaptor iterator UTF-8. Yang saya maksud adalah adaptor yang mengubah iterator ke charatau unsigned charurutan menjadi iterator ke char32_turutan. Pekerjaan saya di sini terinspirasi oleh iterator yang saya temukan online ini . Namun, ketika saya melihat melalui standar ketika saya memulai implementasi saya sendiri, saya menyadari: tampaknya …

8 c++ c++11 unicode utf-8

Pertanyaan yang diberi tag «utf-8»