Структура HTML-документа и элементы разметки заголовка. Часть 1.
Основные понятия: Структура документа, заголовок, head, title, meta, refresh, script,
isindex, style, поисковые машины.
Информация о выпуске:
В выпуске описывается типовая структура HTML-документа, а также структура и содержание его заголовка.
Подробно рассматривается содержание элементов разметки и разбирается формат и назначение
элементов разметки заголовка. Рассматриваются основные конструкции языка, приемы разметки и связь
с другими инструментами разработки WEB-страниц.
HTML-документ — это один большой контейнер, который начинается с тега <HTML> и заканчивается тегом </HTML>:
<HTML>
... ... ...
Содержание документа
... ... ...
</HTML>
Контейнер HTML (или гипертекстовый документ) в свою очередь должен состоять из
двух других вложенных контейнеров: заголовка документа - тег HEAD,
и тела документа тег BODY. Рассмотрим классический пример
такого документа:
Компания Netscape Communication расширила классическую форму документа возможностью организации фреймов (кадров), позволяющих разделить рабочее окно программы просмотра на несколько независимых фреймов. В каждый фрейм можно загрузить свою страницу HTML. Пример документа с фреймами:
Такая структура расширяет возможности и удобство в управлении созданием HTML документов. Тем не менее, в настоящее время многие веб-мастера отказываются от фреймовой структуры из-за трудностей у поисковых роботов, возникающих при обработке таких страниц. Существуем мнение, что фреймовая структура негативно влияет на продвижение сайта посредством поисковых систем, если при этом не применяются специальные методы оптимизации.
Назначение заголовка
Заголовок HTML-документа является необязательным элементом разметки. В HTML 2.0 предлагалось вообще отказаться от элементов HEAD и BODY. В то время в HTML не было элементов, которые использовались одновременно и в заголовке, и в теле документа. Современная практика HTML-разметки такова, что почти в каждом документе есть HTML-заголовок.
Первоначально существование заголовка определялось необходимостью именования окна браузера. Это достигалось за счет элемента разметки TITLE:
Заголовок HTML-документа играет важную роль в работе сценариев JavaScript. Существует принципиальная разница между заголовком и телом документа при использовании элемента разметки SCRIPT. Она заключается в определении зоны видимости функций и переменных. Переменные и функции, определенные в заголовке документа, относятся ко всему окну браузера. Это значит, что к ним можно обращаться из любого места документа, даже из другого окна или фрейма. Фактически, это глобальные переменные. Переменные и функции
сценариев, размещенных не в заголовке, а в теле документа, например работе с "многослойными" страницами, относятся только к слоям.
Еще одной функцией заголовка HTML-документа является управление HTTP-обменом через элементы разметки META. При современной практике размещения веб-сайтов компаний на серверах, принадлежащих другим компаниям - провайдерам, администраторы этих узлов могут не иметь возможности управлять программой-сервером. В этом случае для управления обменом используется заголовок HTML-документа.
Еще одно важное назначение заголовка HTML — это поисковый образ документа для индексирования роботами поисковых систем. Специально предназначенные элементы META позволяют хранить списки ключевых слов и описания документа, которые будут использоваться для составления индекса поисковой системы и появляться в качестве описания документа в случае выдачи ссылки на него при поиске по ключевым словам.
Основные контейнеры заголовка
Основные контейнеры заголовка — это элементы HTML-разметки, которые наиболее часто встречаются в заголовке HTML-документа, т.е. внутри элемента разметки HEAD.
Рассмотрим восемь основных элементов разметки, включая сам элемент разметки HEAD:
HEAD - элемент разметки HEAD;
TITLE - заглавие документа;
BASE - база URL;
ISINDEX - поисковый шаблон;
META - метаинформация;
LINK - общие ссылки;
STYLE - описатели стилей;
SCRIPT - сценарий или скрипт.
Чаще всего применяются элементы TITLE, SCRIPT, STYLE. Использование элемента META говорит об осведомленности автора о правилах индексирования документов в поисковых системах и возможности управления HTTP-обменом данными. BASE и ISINDEX в последнее время практически не применяются. LINK указывают только при использовании внешних относительно данного документа описателей стилей.
Элемент разметки HEAD
Элемент разметки HEAD содержит заголовок HTML-документа. Данный элемент разметки не является обязательным. При наличии тега начала элемента разметки желательно использовать и тег конца элемента разметки. По умолчанию элемент HEAD закрывается, если встречается либо тег начала контейнера BODY, либо тег начала контейнера FRAMESET. Атрибутов у тега начала контейнера нет, хотя в DTD HTML один необязательный атрибут прописан. Синтаксис контейнера HEAD в общем виде выглядит следующим образом:
<HEAD profile="http://www.aho.ru/aho-doc/ru/netiquette.php">
Правила сетевого этикета, которые следует соблюдать при переписке в Сети.
</HEAD>
Контейнер заголовка служит для размещения информации, относящейся ко всему документу в целом. Необязательный атрибут PROFILE указывает на внешний файл META-тегов. В качестве значения этого атрибута указывается URL данного файла.
Элемент разметки TITLE
Элемент разметки TITLE служит для именования документа в Сети. Более прозаическое его назначение — именование окна браузера, в котором просматривается документ. Состоит контейнер из тега начала, содержания и тега конца. Наличие тега конца обязательно. Тег начала элемента не имеет специфических атрибутов.
В различных браузерах алгоритм отображения элемента TITLE может отличаться. Так, в некоторых броузерах можно создать бегущую строку в заголовке документа, указав несколько последовательных контейнеров TITLE:
<TITLE>a</TITLE>
<TITLE>ah</TITLE>
<TITLE>aho</TITLE>
<TITLE>aho.</TITLE>
<TITLE>aho.r</TITLE>
<TITLE>aho.ru</TITLE>
...
<TITLE>aho.ru - надежный и недорогой хостин</TITLE>
<TITLE>aho.ru - надежный и недорогой хостинг</TITLE>
Такой механизм в современных броузерах не работает. При этом следует учитывать, что в отличие от реализации "бегущей" строки средствами JavaScript, лидирующие пробелы в заголовке игнорируются.
При выборе текста для содержания контейнера TITLE следует учитывать, что отображается он системным шрифтом, так как является заголовком окна браузера. Поэтому всегда надо помнить, что в нелокализованных версиях операционных систем и графических оболочек русский текст содержания элемента TITLE может отображаться некорректно.
Синтаксис контейнера TITLE в общем виде выглядит следующим образом:
<TITLE>название документа</TITLE>
Заголовок не является обязательным контейнером документа. Его можно опустить, но следует иметь ввиду то, что роботы многих поисковых систем используют содержание элемента TITLE для создания поискового образа документа. Слова из TITLE попадают в индекс поисковой системы. Из этих соображений элемент TITLE желательно использовать.