Отправляет email-рассылки с помощью сервиса Sendsay

Как раскрутить сайт

  Все выпуски  

Как раскрутить сайт Как устроен индекс поисковой машины (часть 5)


Ведущий рассылки Андрей Луда – предприниматель, личный тренер, специалист в области современного развития человека и организаций.

 

«Если я видел дальше других, то только потому, что стоял на плечах гигантов». Исаак Ньютон

 

Если у вас есть проблема в жизни, и вам нужна помощь, пишите по адресу rasvopros@mail.ru с пометкой «проблема» в теме письма.

 

Здравствуйте, друзья.

 

Твитер http://twitter.com/andrey_luda

Фейсбук http://www.facebook.com/andrej.luda

Вконтакте http://vk.com/andrey_luda

 

 

Продолжаем изучать книгу Игоря Ашманова и Андрея Иванова «Оптимизация и продвижение сайтов в поисковых системах»

 

 

6.3. Как устроен индекс поисковой машины

 

Составление индекса

 

«ПРЯМОЙ» индекс

 

Чтобы показывать при найденных страницах цитаты с выделенными (подсвеченными) словами запроса, поисковые машины хранят все тексты всех проиндексированных страниц. Получается, что поисковики хранят у себя на серверах копию всего Интернета, выкачанного ее индексным «пауком».

Например, Google имеет у себя текстовую копию всего мирового Интернета (в том объеме, до какого смог добраться его «паук»), а «Яндекс» - копию всего Рунета.

Для хранения текстовой копии страниц инверсный индекс не подходит - слишком долго каждый раз при отображении цитаты восстанавливать порядок слов в тексте. Гораздо проще хранить второй индекс, на жаргоне разработчиков называемый прямым. Он представляет собой тексты веб-страниц, очищенные от всех нетекстовых элементов, сжатые и упакованные, и является текстовой копией всего Интернета.

Именно наличие этой текстовой копии позволяет поисковым машинам не только показывать релевантные цитаты в результатах поиска, но и иметь функцию «восстановить текст страницы», которой удобно пользоваться, если сама нужная страница в данный момент недоступна или вообще уже удалена с сайта. В результатах поиска Google такая ссылка называется «Сохраненная копия», а у «Яндекса» - просто «Копия»). Иногда эта копия также называется «кэш страницы».

Большинство поисковых машин хранят копию страниц без НТМL-разметки, графики и прочего «мусора», В чисто текстовом виде (так делает «Рамблер»). Но, например, «Яндекс» С декабря 2006 года сохраняет полную копию страницы, которую можно посмотреть в любой момент даже со всеми картинками. То же самое и у Google - сохраненная страница показывается пользователю в том дизайне и в том оформлении, в каком она была на сайте во время скачивания поисковым роботом.

 

 

Продолжение в следующем выпуске…

 

 

Твитер http://twitter.com/andrey_luda

Фейсбук http://www.facebook.com/andrej.luda

Вконтакте http://vk.com/andrey_luda

 

Поучать может каждый, но стоит ли доверять этим поучениям.

 

Если у вас есть проблема в жизни, и вам нужна помощь, пишите по адресу rasvopros@mail.ru с пометкой «проблема» в теме письма.

 

Все представленные материалы носят ИСКЛЮЧИТЕЛЬНО ознакомительный (образовательный) характер. Некоторые материалы взяты из открытых источников в сети или были присланы подписчиками. Если Вы посчитали, что Ваши авторские права были нарушены - сообщите, и мы вместе постараемся придти к обоюдоприемлемому решению. Обладатели авторских прав на материалы, опубликованные в рассылке, выступающие против их дальнейшего размещения и распространения могут обратиться с просьбой об их удалении.

 

Copyright Андрей Луда, 2006-2015 г.г. Автор оставляет за собой право отвечать не на все полученные письма и опубликовывать полностью или частично, полученные письма без предварительного согласования. В случае, если Вы желаете свое письмо оставить конфиденциальным, письменно сообщите об этом.

Заранее благодарю Вас.


В избранное