Alasan lain untuk memilih yang pendek adalah karena cocok dengan contoh lain di mana Anda dapat menentukan set karakter dalam markup. Sebagai contoh:
<script type="javascript" charset="UTF-8" src="/script.js"></script>
<p><a charset="UTF-8" href="http://example.com/">Example Site</a></p>
Konsistensi membantu mengurangi kesalahan dan membuat kode lebih mudah dibaca.
Perhatikan bahwa atribut charset tidak sensitif-huruf. Anda dapat menggunakan UTF-8 atau utf-8, namun UTF-8 lebih jelas, lebih mudah dibaca, lebih akurat.
Juga, sama sekali tidak ada alasan sama sekali untuk menggunakan nilai apa pun selain UTF-8 dalam atribut meta charset atau header halaman. UTF-8 adalah penyandian standar untuk dokumen Web sejak HTML4 pada tahun 1999 dan satu-satunya cara praktis untuk membuat halaman Web modern.
Anda juga sebaiknya tidak menggunakan entitas HTML di UTF-8. Karakter seperti simbol hak cipta harus diketik langsung. Satu-satunya entitas yang harus Anda gunakan adalah untuk 5 karakter markup yang dipesan: kurang dari, lebih besar dari, ampersand, prime, double prime. Entitas memerlukan parser HTML, yang mungkin tidak selalu ingin Anda gunakan untuk maju, mereka memperkenalkan kesalahan, membuat kode Anda kurang mudah dibaca, menambah ukuran file Anda, dan kadang-kadang memecahkan kode yang salah di berbagai browser tergantung pada entitas yang Anda gunakan. Pelajari cara mengetik / menyisipkan hak cipta, merek dagang, kutipan terbuka, kutipan dekat, apostrof, em dash, en dash, bullet, Euro, dan karakter lain apa pun yang Anda temui dalam konten Anda, dan gunakan karakter aktual tersebut dalam kode Anda. Mac memiliki Penampil Karakter yang dapat Anda aktifkan di Preferensi Sistem Keyboard, dan Anda dapat menemukan dan kemudian seret dan jatuhkan karakter yang Anda butuhkan, atau gunakan Penampil Keyboard yang cocok untuk melihat tombol mana yang harus diketik. Misalnya, merek dagang adalah Opsi + 2. UTF-8 berisi semua karakter dan simbol dari setiap bahasa manusia yang ditulis. Jadi tidak ada alasan untuk menggunakan - sebagai ganti tanda hubung. Bukan ide yang buruk untuk mempelajari aturan tanda baca dan tipografi juga ... misalnya, mengetahui bahwa suatu periode masuk dalam kutipan dekat, bukan di luar.
Menggunakan tag untuk sesuatu seperti tipe konten dan pengodean sangat ironis, karena tanpa mengetahui hal-hal itu, Anda tidak dapat menguraikan file untuk mendapatkan nilai dari tag meta.
Tidak, itu tidak benar. Browser mulai mem-parsing file sebagai penyandian default browser, baik UTF-8 atau ISO-8859-1. Karena US-ASCII adalah bagian dari ISO-8859-1 dan UTF-8, peramban dapat membaca dengan baik apa pun ... itu sama. Saat peramban menemukan tag meta charset, jika penyandiannya berbeda dari yang sudah digunakan peramban, peramban memuat ulang laman dalam penyandian yang ditentukan. Itulah sebabnya kami meletakkan tag meta charset di bagian atas, tepat setelah tag kepala, sebelum yang lainnya, bahkan judulnya. Dengan begitu Anda dapat menggunakan karakter UTF-8 dalam judul Anda.
Anda harus menyimpan file Anda dalam pengkodean UTF-8 tanpa BOM
Itu tidak sepenuhnya benar. Jika Anda hanya memiliki karakter US-ASCII dalam dokumen Anda, Anda dapat menyimpannya sebagai US-ASCII dan menyajikannya sebagai UTF-8, karena itu adalah himpunan bagian. Tetapi jika ada karakter Unicode, Anda benar, Anda harus Simpan sebagai UTF-8 tanpa BOM.
Jika Anda menginginkan editor teks yang baik yang akan menyimpan file Anda di UTF-8, saya sarankan Notepad ++.
Di Mac, gunakan Bare Bones TextWrangler (gratis) dari Mac App Store, atau Bare Bones BBEdit yang ada di Mac App Store seharga $ 39,99 ... sangat murah untuk alat yang hebat. Di salah satu aplikasi, ada menu di bagian bawah jendela dokumen tempat Anda menentukan penyandian dokumen dan Anda dapat dengan mudah memilih "UTF-8 no BOM". Dan tentu saja Anda dapat menetapkan itu sebagai default untuk dokumen baru di Preferensi.
Tetapi jika Webserver Anda melayani pengkodean di header HTTP, yang direkomendasikan, kedua [tag meta] tidak diperlukan.
Itu tidak benar. Anda tentu saja harus mengatur pengkodean di header HTTP, tetapi Anda juga harus mengaturnya dalam atribut meta charset sehingga halaman dapat disimpan oleh pengguna, keluar dari browser ke penyimpanan lokal dan kemudian dibuka lagi nanti, dalam hal ini satu-satunya indikasi pengkodean yang akan hadir adalah atribut meta charset. Anda juga harus menetapkan tag dasar untuk alasan yang sama ... di server, tag dasar tidak perlu, tetapi ketika dibuka dari penyimpanan lokal, tag dasar memungkinkan halaman berfungsi seolah-olah itu di server, dengan semua aset di tempat dan sebagainya, tidak ada tautan rusak.
AddDefaultCharset UTF-8
Atau Anda dapat mengubah penyandian jenis file tertentu seperti:
AddType text/html;charset=utf-8 html
Kiat untuk menyajikan file UTF-8 dan Latin-1 (ISO-8859-1) adalah untuk memberi file "teks" ekstensi UTF-8 dan file Latin-1 "txt."
AddType text/plain;charset=iso-8859-1 txt
AddType text/plain;charset=utf-8 text
Akhirnya, pertimbangkan untuk Menyimpan dokumen Anda dengan ujung jalur Unix, bukan warisan legacy DOS atau (klasik), yang tidak membantu dan mungkin menyakitkan, terutama di telepon saat kami semakin jauh dari sistem warisan tersebut. Dokumen HTML dengan penyandian HTML5, UTF-8, dan akhiran baris Unix yang valid adalah pekerjaan yang dilakukan dengan baik. Anda dapat berbagi dan mengedit, menyimpan, membaca, memulihkan, dan mengandalkan dokumen itu dalam banyak konteks. Itu adalah bahasa pergaulan. Ini kertas digital.