Продолжаем изучать книгу Игоря Ашманова и Андрея Иванова
«Оптимизация и продвижение сайтов в поисковых системах»
6.3. Как устроен индекс поисковой машины
Лингвистическая обработка
В большинстве
поисковых машин слова не заносятся в индекс в том виде, в котором они приведены
в тексте.
Обычно на этапе
выборки слов из текстов веб-страниц поисковая машина применяет какой-то свой
алгоритм лингвистической обработки слов, а именно, приведения слов к их
начальным грамматическим формам, или основам (грубо говоря, к именительному падежу).
Этот алгоритм называется машинной морфологией. Делается это для экономии места
в индексе и, что еще важнее, для более точного поиска.
По поводу
использования машинной морфологии в поисковиках также бытует довольно много
мифов и домыслов, так что ниже, в отдельном разделе, мы специально коснемся
этого вопроса. Пока же достаточно сказать, что машинная морфология служит для
замены слов на их основы в индексе поисковика.
Поучать может каждый, но стоит ли доверять этим поучениям.
Если у вас есть проблема в жизни, и вам нужна помощь, пишите
по адресу rasvopros@mail.ru с пометкой «проблема» в теме
письма.
Все представленные материалы носят ИСКЛЮЧИТЕЛЬНО
ознакомительный (образовательный) характер. Некоторые материалы взяты из
открытых источников в сети или были присланы подписчиками. Если Вы посчитали,
что Ваши авторские права были нарушены - сообщите, и мы вместе постараемся
придти к обоюдоприемлемому решению. Обладатели авторских прав на материалы,
опубликованные в рассылке, выступающие против их дальнейшего размещения и
распространения могут обратиться с просьбой об их удалении.
Copyright Андрей Луда, 2006-2015 г.г. Автор оставляет за
собой право отвечать не на все полученные письма и опубликовывать полностью или
частично, полученные письма без предварительного согласования. В случае, если
Вы желаете свое письмо оставить конфиденциальным, письменно сообщите об этом.