Pendeknya adalah bahwa HTML didasarkan pada bahasa markup non-hyperlink lainnya yang disebut SGML yang sering digunakan untuk dokumentasi dan manual dan sejenisnya.
Dari sebuah artikel tentang sejarah HTML:
Tim telah menyebutkan bahwa beberapa dokumen HTML awal didasarkan pada bahasa SGML lama yang sudah digunakan CERN: - Kami telah memasukkan dalam HTML beberapa tag dari tagset SGML yang digunakan di dan pernah didukung di CERN [...] Pengurai HTML akan mengabaikan tag yang tidak dimengerti, dan akan mengabaikan atribut yang tidak mengerti tag CERN-SGML .
[...] sebagian besar tag HTML awal sebenarnya diambil dari bahasa CERN SGMLGuid, yang itu sendiri adalah varian dari AAP (bahasa SGML awal). Sebagai contoh, judul, hn, p, ol dan sebagainya semuanya tampaknya diambil dari bahasa ini. Satu-satunya perubahan radikal adalah penambahan tautan anchor () penting, yang tanpanya WWW tidak akan lepas landas.
Mencatat bagian yang saya cetak tebal, pada dasarnya, mereka menerapkan subset dari tag yang tersedia di sistem SGML yang mereka kenal, menambahkan tag anchor <a> baru, dan memilih untuk mengabaikan salah satu dari banyak tag yang mereka tidak lakukan. t peduli atau ingin mendukung karena alasan apa pun (seperti tag untuk daftar pustaka, xmp untuk tag "contoh", "kotak" untuk menggambar kotak di sekitar blok teks, dll). Jadi cara paling sederhana untuk melakukannya adalah dengan memaafkan markup yang tidak diketahui oleh parser dan mengabaikan markup yang tidak diketahui sebaik mungkin, terlepas dari apakah penyebabnya adalah pengguna mengetikkan markup buruk, atau cara termudah tercepat untuk mengubah dokumen yang ada menjadi format HTML baru ini adalah untuk menambahkan beberapa hyperlink ke dokumen SGML yang ada, dan mengabaikan tag apa pun yang tidak didukung atau diterapkan.