Rekayasa Perangkat Lunak character-encoding

2

Bagaimana cara mendeteksi penyandian file?

Pada sistem file saya (Windows 7) saya memiliki beberapa file teks (Ini adalah file skrip SQL, jika itu penting). Ketika dibuka dengan Notepad ++ , di menu "Encoding" beberapa dari mereka dilaporkan memiliki encoding "UCS-2 Little Endian" dan beberapa "UTF-8 tanpa BOM". Apa bedanya di sini? Semua itu tampaknya merupakan …

115 file-systems character-encoding utf-8 notepad++

5

Apa keuntungan memilih pengkodean ASCII dari pada UTF-8?

Semua karakter dalam ASCII dapat dikodekan menggunakan UTF-8 tanpa peningkatan penyimpanan (keduanya membutuhkan byte penyimpanan). UTF-8 memiliki manfaat tambahan dukungan karakter di luar "ASCII-karakter". Jika itu yang terjadi, mengapa akan kita pernah memilih ASCII encoding lebih UTF-8? Apakah ada use case ketika kita akan memilih ASCII bukan UTF-8?

91 character-encoding utf-8 ascii

2

Mengapa begitu banyak string hash dan terenkripsi berakhir dengan tanda sama dengan?

Saya bekerja di C # dan MSSQL dan seperti yang Anda harapkan saya menyimpan kata sandi saya asin dan hash. Ketika saya melihat hash yang disimpan dalam kolom nvarchar (misalnya penyedia kotak aspnet keanggotaan out). Saya selalu ingin tahu mengapa nilai-nilai Salt dan Hash yang dihasilkan selalu berakhir dengan satu …

64 hashing character-encoding

3

Mengapa kita harus meletakkan N sebelum string di Microsoft SQL Server?

Saya sedang belajar T-SQL. Dari contoh yang saya lihat, untuk memasukkan teks ke dalam varchar()sel, saya dapat menulis hanya string yang akan disisipkan, tetapi untuk nvarchar()sel, setiap contoh awalan string dengan huruf N. Saya mencoba kueri berikut pada tabel yang memiliki nvarchar()baris, dan berfungsi dengan baik, jadi awalan N tidak …

34 sql sql-server character-encoding unicode

8

Haruskah penyandian karakter selain UTF-8 (dan mungkin UTF-16 / UTF-32) dihentikan?

Kencing hewan peliharaan saya sedang melihat begitu banyak proyek perangkat lunak yang memiliki banyak kode untuk dukungan set karakter. Jangan salah paham, saya semua mendukung kompatibilitas, dan saya senang editor teks membiarkan Anda membuka dan menyimpan file dalam beberapa set karakter. Yang mengganggu saya adalah bagaimana proliferasi pengkodean karakter non-universal …

31 unicode utf-8 character-encoding

7

Apakah char carriage-return dianggap usang

Saya menulis pustaka sumber terbuka yang mem-parsing data terstruktur tetapi sengaja mengabaikan deteksi carriage-return karena saya tidak mengerti intinya. Ini menambah kompleksitas dan overhead tambahan untuk sedikit / tanpa manfaat. Yang mengejutkan saya, seorang pengguna mengirimkan bug di mana parser tidak berfungsi dan saya menemukan penyebab masalah adalah bahwa data …

26 mac osx character-encoding software-obsolescence

5

Masalah apa yang membuat orang menggunakan pengkodean khusus Jepang dan bukan Unicode?

Di tempat kerja saya menemukan banyak file teks Jepang di Shift-JIS dan penyandian lainnya. Ini menyebabkan banyak masalah mojibake (karakter yang tidak dapat dibaca) untuk semua pengguna komputer. Unicode dimaksudkan untuk menyelesaikan masalah semacam ini dengan mendefinisikan satu set karakter untuk semua bahasa, dan serialisasi UTF-8 direkomendasikan untuk digunakan di …

24 legacy unicode character-encoding

4

Mengapa UTF-8 membuang beberapa bit dalam pengkodeannya

Menurut artikel Wikipedia , UTF-8 memiliki format ini: Kode pertama Kode terakhir Bytes Byte 1 Byte 2 Byte 3 Byte 4 point point Digunakan U + 0000 U + 007F 1 0xxxxxxx U + 0080 U + 07FF 2 110xxxxx 10xxxxxx U + 0800 U + FFFF 3 1110xxxx 10xxxxxx …

17 character-encoding utf-8 text-encoding

2

Apakah UTF-16 memiliki lebar tetap atau lebar variabel? Mengapa UTF-8 tidak memiliki masalah byte-order?

Apakah UTF-16 memiliki lebar tetap atau lebar variabel? Saya mendapat hasil berbeda dari sumber berbeda: Dari http://www.tbray.org/ongoing/When/200x/2003/04/26/UTF : UTF-16 menyimpan karakter Unicode dalam potongan enam belas-bit. Dari http://en.wikipedia.org/wiki/UTF-16/UCS-2 : UTF-16 (16-bit Unicode Transformation Format) adalah pengkodean karakter untuk Unicode yang mampu mengkodekan angka 1.112.064 [1] (disebut titik kode) dalam ruang …

16 unicode character-encoding utf-8

3

Haruskah kode sumber saya berada di UTF-8?

Saya merasa bahwa Anda sering tidak benar-benar memilih format apa kode Anda. Maksudku sebagian besar alat saya di masa lalu telah memutuskan untuk saya. Atau saya bahkan belum memikirkannya. Saya menggunakan TextPad di windows tempo hari dan ketika saya sedang menyimpan file, itu mendorong saya tentang ASCII, UTF-8/16, Unicode dll …

10 coding-standards source-code character-encoding utf-8

Pertanyaan yang diberi tag «character-encoding»