Seperti jawaban sebelumnya, himpunan karakter adalah himpunan karakter (huruf, angka, ideogram, dll.) Yang ditugaskan untuk suatu angka; untuk dapat melihatnya, Anda harus memiliki font ("gambar" kecil yang kita baca). Mereka penting menggunakan LatinX, karena untuk setiap X, angka (byte) yang sama dapat merujuk ke karakter yang berbeda.
Saat ini lebih penting untuk memilih pengkodean: standarnya adalah UTF-8, representasi Unicode paling sukses (kompatibel dengan ASCII tetapi sangat fleksibel untuk memasukkan semua bahasa, bahkan Cina dan Jepang) dan standar W3C. Dengan kata lain, itu termasuk semua set karakter.
Collation: ini adalah kata mode lama, berasal dari bahasa Latin. Artinya: bandingkan salinan (manuskrip) dengan yang asli untuk menemukan perbedaan (kesalahan atau perubahan). Itu sangat berguna di masa lalu, tetapi sekarang hampir kuno karena dokumen dan buku kami ditulis menggunakan komputer dan salinannya selalu identik dengan aslinya. Contoh: dalam bahasa Italia (berasal dari bahasa latin) ada kata kerja "collazionare", tetapi dalam kamus dan tidak ada yang menggunakannya.
Jadi, susunan mendefinisikan perilaku operator pembanding: =,>, <, <=,> = ...
Tentu saja para operator itu digunakan untuk memutuskan apakah dua string adalah sama, atau jika sebuah kata "lebih besar" dari yang lain, sangat penting jika kita ingin mengurutkan. Huruf-hurufnya tidak dalam urutan yang sama untuk setiap bahasa, jadi sebuah kata bisa lebih besar dari yang lain menggunakan susunan, tetapi tidak menggunakan yang lain. Lihat [1] untuk contoh praktis.
koleksi "bin" adalah yang paling ketat: SELECT "b" = "B" => FALSE
koleksi "ci" tidak peka huruf besar-kecil: SELECT "b" = "B" => TRUE
"umum" cenderung mengabaikan beberapa perbedaan: PILIH "a" = "à" => BENAR
lainnya khusus untuk satu atau lebih bahasa. Contoh "swedia" (Saya tidak tahu mengapa swedia sering default)
Saya masih mencari situs web di mana perilaku setiap pemeriksaan dijelaskan secara rinci ... contoh-contoh tersebut adalah karena pengalaman saya.
[1] http://www.olcot.co.uk/sql-blogs/revised-difference-between-collation-sql_latin1_general_cp1_ci_as-and-latin1_general_ci_as