Продолжаем изучать книгу Игоря Ашманова и Андрея Иванова
«Оптимизация и продвижение сайтов в поисковых системах»
6.2. Как работает поисковая машина
Составление индекса, или индексирование
Чтобы составить
индекс, индексный робот поисковой машины должен выбрать все слова из всех
выкачанных текстов и расположить их в алфавитном порядке, вместе с номерами
страниц и разной служебной информацией о каждой странице. Для этого индексный
робот перебирает все выкачанные страницы, нумерует их (а как же, ведь нужно
как-то пометить страницы, чтобы потом находить их), удаляет из текста страниц
всякий ненужный, нетекстовый «мусор» (например, разметку языка нтмl), затем извлекает из текста слова и помещает
их в индекс. При этом слова снабжаются информацией о страницах, с которых они
были взяты. Как именно устроен индекс, мы подробно расскажем чуть позже.
Поучать может каждый, но стоит ли доверять этим поучениям.
Если у вас есть проблема в жизни, и вам нужна помощь, пишите
по адресу rasvopros@mail.ru с пометкой «проблема» в теме
письма.
Все представленные материалы носят ИСКЛЮЧИТЕЛЬНО
ознакомительный (образовательный) характер. Некоторые материалы взяты из
открытых источников в сети или были присланы подписчиками. Если Вы посчитали,
что Ваши авторские права были нарушены - сообщите, и мы вместе постараемся
придти к обоюдоприемлемому решению. Обладатели авторских прав на материалы,
опубликованные в рассылке, выступающие против их дальнейшего размещения и
распространения могут обратиться с просьбой об их удалении.
Copyright Андрей Луда, 2006-2015 г.г. Автор оставляет за
собой право отвечать не на все полученные письма и опубликовывать полностью или
частично, полученные письма без предварительного согласования. В случае, если
Вы желаете свое письмо оставить конфиденциальным, письменно сообщите об этом.