Saya telah mempelajari subjek ini selama beberapa hari dan telah menemukan banyak saran yang saling bertentangan berkaitan dengan pengindeksan pencarian. Saya sedang mengerjakan proyek yang memiliki banyak halaman berbeda mulai dari deskripsi produk sederhana hingga dokumentasi pengguna yang mendalam.
Saya telah memecah pertanyaan ini menjadi beberapa bagian karena saya merasa ini akan membuatnya lebih berguna bagi pembaca masa depan dari pertanyaan ini.
Beberapa temuan saya
Beberapa situs web tampaknya memiliki garis besar dokumen seperti berikut ini:
1. Programmer's Guide (https://www.dartlang.org/docs/)
1. Getting Started
2. Concepts
1. Libraries
2. Fundamental classes
etc.
Saya merasa menarik bahwa contoh di atas tidak memanfaatkan <nav>
elemen dengan tajuk yang sesuai. Saya suka kesederhanaan garis besar dan menjadi Google saya cukup yakin bahwa mereka tahu apa yang mereka lakukan ketika sampai pada hal ini.
Tapi saya bingung karena garis besar di atas tidak menyebutkan "Dart". Satu-satunya penyebutan "Dart" dalam arti semantik tampaknya berada dalam <title>
elemen dokumen utama "Panduan Programmer | Dart: Aplikasi web terstruktur".
MDN (Jaringan Pengembang Mozilla) adalah contoh cemerlang lain dari situs web yang mengikuti prinsip ini. Banyak <h1>
judul yang menyediakan konteks lengkap ( Bagian dan Garis Besar Dokumen HTML5 ):
1. Sections and Outlines of an HTML5 Document
1. Untitled Section (nav)
2. Untitled Section (nav)
3. Structure of a Document in HTML 4
4. Problems Solved by HTML5
Sementara yang lain tidak masuk akal di luar konteks ( Praktek usang untuk dihindari ). Sebagai contoh, apakah garis besar HTML5 berikut berhubungan dengan CSS, HTML5 atau C # ... hanya dengan garis besar dokumen yang harus dilalui, siapa tahu!
1. Obsolete practices to avoid
1. Untitled Section (nav)
2. Untitled Section (nav)
3. Doctype
4. <meta> element and charset attribute
Untuk memperburuk keadaan, bagaimana jika MDN berisi 2 topik dengan judul yang sama (atau sangat mirip) "Praktek usang untuk dihindari" di mana satu adalah bagian dari panduan CSS mereka dan yang lainnya adalah bagian dari panduan HTML mereka ...
Di ujung lain spektrum situs web tampaknya menggunakan <body>
tajuk tingkat- utama untuk nama produk (Foo) atau wadah topik (Panduan Pengguna untuk Foo). Di mana semua halaman selanjutnya kemudian digunakan <h2>
untuk judul halaman yang sebenarnya.
Pertanyaan
Bagaimana mesin pencari menyimpulkan konteks halaman web seperti yang ditemukan di situs web MDN menggunakan DOM dan garis besar HTML5?
Apa cara yang tepat untuk menandai halaman HTML5 berikut sehingga Google dapat mengindeks halaman dalam konteks yang sesuai? Ini termasuk penggunaan <title>
, <header>
dan <h1>
elemen.
- Nama Perusahaan
- nama Produk
- Panduan pengguna
- Mulai
Judul paling penting dalam HTML yang dilihat di browser web, haruskah ini mewakili konteks seluruh situs web (Nama Perusahaan atau Nama Produk), kumpulan topik (Panduan Pengguna) atau topik aktual di tangan (Memulai) ?
Tebakan terbaik saya
<!DOCTYPE html>
<html>
<head>
<title>Getting Started | User Guide | Product Name - Company Name</title>
</head>
<body>
<header role="banner"> <!-- Note: Lack of <h1> in here -->
<a id="logo" href="http://example.com">Company Name</a>
<nav>
<h1>Site Navigation</h1>
<ul> ... </ul>
</nav>
</header>
<main role="main">
<div class="product-name">Product Name</div>
<div class="document">User Guide</div>
<h1>Getting Started</h1>
<p>blah</p>
</main>
</body>
</html>
Menuju garis besar:
1. Getting Started
<title>
untuk memberikan konteks. Sebagai contoh, apakah itu ide yang buruk untuk memasukkan yang sama <h1>User Guide for Ubermachine</h1>
pada setiap halaman di mana judul topik disajikan dengan <h2>Getting Started</h2>
... atau harus garis besar dimulai <h1>Getting Started</h1>
dengan yang menyertainya <title>Getting Started | User Guide for Ubermachine</title>
untuk memberikan konteks yang berguna untuk mesin pencari. Ini pertanyaan SEO.
<title>
menyediakan konteks yang cukup.