Интернет глазами пользователя.
Гид по поисковым системам. www.inetgp.ru
Обзор русскоязычных поисковых систем.
Обычно, начиная искать что либо в интернете мы в первую очередь обращаемся к поисковым системам, или, как их обычно называют, поисковикам. Именно с помощью поисковиков мы находим 90% нужной информации и интересных сайтов. И скорее всего в будущем эта ситуация останется неизменной – поисковики будут совершенствовать свои механизмы, а мы также будем обращаться к ним в поисках нужных нам сведений.
Не вдаваясь в технические подробности можно сказать, что поисковики работают следующим образом: пользователь вводит одно или несколько ключевых слов, которые по его мнению лучше всего отражают суть интересующего вопроса, поисковая система просматривает свой каталог web-страниц, и в результате выдает список страниц, в которых встретились указанные слова. Так или иначе работа всех поисковиков сводиться к этой базовой схеме.
Яндекс на сегодняшний день является самой популярной русскоязычной поисковой системой.
Лично я использую именно его в качестве поисковика №1 для информации на русском языке. Отличается простотой, дружелюбным интерфейсом, очень удобен в использовании и обеспечивает весьма неплохое качество поиска.
Яндекс ищет по рунету документы на русском, украинском, белорусском, румынском, английском, немецком и французском языках с учётом морфологии русского и английского языков и близости слов в предложении.
Помимо веб-страниц в формате HTML, Яндекс индексирует документы в форматах PDF (Adobe Acrobat), Rich Text Format (RTF), форматах Microsoft Word, Microsoft Excel, Microsoft PowerPoint, SWF (Macromedia Flash), RSS (блоги и форумы).
Google является самым популярным поисковиком в мире. Примерно шесть из десяти находящихся в интернете людей обращаются именно к его странице в поисках нужной им информации. В русскоязычном секторе интерната Google занимает второе место.
Я так же рекомендую использовать его для поиска документов на русском языке, однако лично я чаще использую его для поиска информации на других языках (как правило на английском – тут Google вне конкуренции).
Рамблер - первая русская поисковая система, изначально был самым популярным поисковиком в рунете но позже уступил лидерство Яндексу и сейчас борется с Гуглом за второе место. В целом весьма неплохая поисковая система, обеспечивающая приемлемое качество поиска.
Поисковая система Рамблер понимает и различает слова русского, английского и украинского языков. По умолчанию поиск ведётся по всем формам слова. По умолчанию в Рамблере результаты ранжируются по степени соответствия (релевантность) запросу и группируются по сайтам.
Nigma – одна из самых молодых поисковых систем рунета, создана в 2005 году студентами и аспирантами факультетов ВМиК и психологии МГУ имени М. В. Ломоносова.
Nigma осуществляет поиск как по своему индексу, так и по базам Google, Yahoo, MSN, Yandex, Rambler, AltaVista, Aport.
19 апреля 2007 года в суммарном индексе всех этих поисковых систем находится более 5’500’000’000 русскоязычных документов.
На основе введённого пользовательского запроса Nigma формирует список документов, разделённых на несколько классов (кластеров). Пользователь может уточнить в каком классе продолжить поиск, тем самым улучшив релевантность результатов поиска.
Кроме того Nigma ищет документы с учетом русской орфографии, объединяет результаты, полученные с разных поисковых систем, использует запросы пользователей для улучшения качества кластеризации и счетчики для сортировки результатов поиска, а также корректирует возможные ошибки.
Имеется облегченная версия: http://nigma.ru/index.php?view=lite
Эффективный поиск.
Часто вводя в строке поиска интересующий вас запрос, в качестве результаты мы получаем тысячи ссылок на сайты, большинство из которых не содержат ничего кроме мусора, рекламы или просто не соответствуют интересующей нас теме.
Как же найти то что нас интересует не перелопачивая сотни «левых» сайтов?
Количество полезных ссылок зависит, прежде всего, от того, насколько грамотно и правильно выбрана фраза для поиска. Для начала можно попробовать ввести выбранную фразу дословно и посмотреть на результаты. Если найдено слишком много ссылок постарайтесь уточнить запрос – для этого можно добавить новые ключевые слова или же поставить фразу в кавычки – тогда будет искаться точное соответствие. Кроме того очень полезным будет поиск в найденном.
Если же наоборот в ответ на ваш запрос ничего не нашлось, постарайтесь задать более общий запрос или выберите другие ключевые слова.
Также очень полезным будет возможность расширенного поиска – воспользовавшись им можно легко настроить дополнительные параметры поиска (например такие как: расположение ключевых слов, тип и возраст искомого документа, регион, язык документа и т.д.). Например, на запрос о гостиницах Турции, в выдаче могут оказаться документа трехлетний давности, информация в которых явно устарела. Так что очень полезным будет ограничить дату документа последними тремя месяцами или годом.
Однако во многом это были общие советы, а чтобы использовать поисковики с максимальной отдачей стоит познакомиться с языком поисковых запросов.
Вот примеры самых популярных поисковых операторов:
1. Запрос в кавычках («ваш запрос») выдает только фразы точно соответствующие вашему запросу.
2. Оператор «OR» (Google) или «|» (Яндекс) – ищет любое из перечисленных слов.
Например запрос: «аэроплан | самолет | планер | дирижабль | аэростат | вертолет | пепелац» найдет страницы, где встречается хоть одно из этих слов.
3. Оператор «–»(Google) или «~~» (Яндекс) - позволяет исключать страницы, где есть определенные слова. Для этого используется оператор ~~, слева от которого вы пишите «что искать», а справа - какие страницы исключать из поиска.
Например если вы ищете информацию о Задорнове (но не министре), можете задать запрос Задорнов ~~ министр. Будут найдены все страницы, где есть слово Задорнов и нет слова министр.
Но это лишь несколько наиболее популярных операторов, на самом деле их огромное множество и они несколько отличаются для различных поисковых систем.
Вы сможете узнать больше о языке поисковых запросов по следующим ссылкам: