Отправляет email-рассылки с помощью сервиса Sendsay
  Все выпуски  

Секреты Windows: статьи о реестре, rundll32.exe, программах


Глава 5. Поиск информации. Поиск информации в Интернете - другие поисковые системы
Дата: 12 февраля 2010, пятница

Новинки нашей сети


http://mycms.com.ua. Добавлено описание темы оформления для CMS Drupal Async.
false.in.ua. В галерею Рот добавлены изображения возможных форм рта и причесок, а также характеристики людей с такими формами.
http://gal.co.ua. В галерею Объекты для дизайнера добавлены новые объекты: различные торты и тортики.
http://arts.biz.ua. Добавлен урок по Photoshop: Создаем эффект надписи, написанной на запотевшем стекле.

В конец записи

Рамблер

Дата создания: сентябрь 1996 года.
Адрес: HTTP://WWW.RAMBLER.RU (главная страница),
 HTTP://WWW.R0.RU/ (только форма для поиска),
 HTTP://PDA.RAMBLER.RU/INDEX.JSPX 
 (главная страница для карманных компьютеров).

Данная поисковая система была создана фирмой СТЕК для реализации поиска по русскоязычным сайтам, находящимся в домене .ru, а также в доменах некоторых из стран СНГ. Она считается третьей в тройке лидеров русскоязычных поисковых систем (Google, Яндекс, Рамблер).

Особенность данной поисковой системы в том, что она индексирует только содержимое страниц, находящихся в доменах .ru, .su, .ua, .by, .kz, .kg, .uz, .ge. То есть, она индексирует только содержимое русскоязычных страниц, игнорируя страницы с других доменов.

Также следует учитывать, что индексации подлежит только «видимое» содержимое страниц. Например, содержимое комментариев и тегов <META> не индексируется. Также не индексируется текстовая информация из флеш-объектов.

Правила поиска

Прежде всего, следует заметить, что в отличие от предыдущих поисковых систем, данная поисковая система может обрабатывать знаки препинания. А вот стоп-слова (незначащие слова, например, предлоги, частицы и артикли), по умолчанию игнорируются. Если же вы хотите выполнить поиск с учетом какого-либо незначащего слова, тогда поисковую фразу нужно взять в двойные кавычки.

Если слово или фраза взята в двойные кавычки, тогда поисковая система ищет ее как есть. То есть, для фразы, взятой в двойные кавычки, морфологический поиск не выполняется. Кстати, поисковая система Рамблер может выполнять поиск с учетом морфологии только для русского и английского языка.

Расстояние между словами По умолчанию поисковая система игнорирует регистр слов поискового запроса. Однако для этого правила есть одно исключение. Если поисковый запрос состоит из 2-4 слов, каждое из которых написано с прописной буквы, тогда для такого поискового запроса автоматически изменяется максимально возможное расстояние между словами запроса (это расстояние становится равным (n-1)*2, где n — количество слов в запросе). То есть, такой запрос позволяет найти страницы, на которых между словами запроса находится не более одного лишнего слова.

В остальных случаях поисковая система ищет страницы, в которых между словами запроса находится не более 40 слов. Чтобы изменить это правило, достаточно воспользоваться запросом вида (число, запрос), где число определяет максимальное количество лишних слов, которые могут находиться между словами запроса.

Логические операторы Поисковая система Рамблер способна обрабатывать три основных логических оператора: И, ИЛИ и НЕ.

Поиск сразу всех слов (то есть, логическое И) выполняется при помощи оператора AND (либо оператора &, который является его полным аналогом), который нужно поместить между словами. Например, по запросу собака AND кошка найдутся только те документы, которые содержат и слово собака, и слово кошка. Оператор AND используется поисковой системой по умолчанию, поэтому его можно не указывать.

Поиск одного из нескольких слов (логическое ИЛИ) выполняется при помощи оператора OR (либо оператора |, который является его полным аналогом), который также нужно поместить между словами. Например, по запросу собака OR кошка найдутся все документы, в которых встречается либо слово собака, либо слово кошка.

Поиск документов, которые не содержат определенное слово (логическое НЕ), выполняется при помощи оператора NOT. Его нужно поместить перед словом, которое не должно присутствовать в документе.

Операторы AND и NOT имеют более высокий приоритет, чем оператор OR, поэтому поисковая система, при обработке запроса, сначала выполняет группировку по операторам AND и NOT, и лишь потом по операторам OR. Изменить порядок группировки можно при помощи круглых скобок.

Команды поиска

Помимо обычных запросов поисковая система Рамблер поддерживает возможность использования команд. А точнее, только одной команды…

${counter=ID} С помощью команды данного вида можно выполнить поиск страниц в одном из рейтингов поисковой системы Рамблер. Рейтинг определяет словом counter, вместо которого можно использовать следующие слова: top100, toplist, spylog или hotlog. Раздел же рейтинга определяется ID, которая представляет собой номер раздела.

Например, для поиска в разделе открыток рейтинга top100 используется оператор ${top100=193680}.

Результаты поиска

В качестве результатов поиска поисковая система Рамблер отображает одну строку содержимого найденной страницы, которое удовлетворяет введенному вами поисковому запросу. Рядом с этим содержимым также отображается несколько ссылок, с помощью которых можно выполнить дополнительные действия.

  • ВОССТАНОВИТЬ ТЕКСТ. Отображает страницу, хранящуюся в кэше поисковой системы Google.
  • ВСЕГО. Отображает все страницы данного сайта, удовлетворяющие вашему запросу. В частности, данную ссылку можно использовать для поиска правильной страницы сайта, если она содержит в себе фреймы и текущая ссылка на страницу отображает только один из фреймов страницы.

По умолчанию результаты поиска выдаются в порядке соответствия вашему запросу, однако вы можете выбрать и другой порядок поиска (по релевантности отдельных страниц или по дате). Делается это на странице результатов поиска.

Расширенный поиск При помощи страницы расширенного поиска (HTTP://WWW.RAMBLER.RU/CGI-BIN/ADVANCED.CGI?SET=WWW) можно выполнить поиск с применением следующих возможностей.

  • Определить область поиска: в содержимом страницы, в названии страницы или в ссылках страницы.
  • Определить отношения слов поисковой фразы: поиск всех слов (логическое И), поиск хотя бы одного слова (логическое ИЛИ), либо поиск точной фразы.
  • Определить, будет ли ограничиваться расстояние между словами.
  • Указать слова, которые не должны встречаться на найденных страницах.
  • Определить язык документа (русский, английский или украинский).
  • Определить формат документов, внутри которых можно выполнять поиск (HTML-страницы, DOC-файлы, PDF-файлы).
  • Определить дату модификации документов.
  • Определить сайт, на страницах которого нужно выполнить поиск.

Апорт

Адрес: HTTP://WWW.APORT.RU (главная страница),
 HTTP://WWW.AU.RU/ (только форма поиска без рекламы),
 HTTP://PDA.APORT.RU/ (версия для карманных компьютеров),
 HTTP://WWW.APORT.RU/WAP (версия для мобильных телефонов).

Данная поисковая система является проектом фирмы Агама при поддержке российского отделения Intel. Она предназначена для поиска в Российской части Интернета, а также на русскоязычных серверах СНГ.

Правила поиска

Как и предыдущие поисковые системы, поисковая система Апорт позволяет выполнять поиск слов с учетом морфологии, игнорируя при этом различные незначащие слова (отменить игнорирование незначащих слов можно при помощи взятия поисковой фразы в кавычки).

Логические операторы Апорт поддерживает те же логические операторы, что и поисковая система Рамблер.

Так, поиск сразу всех слов выполняется при помощи оператора AND или оператора &, который является его полным аналогом. Например, собака AND кошка.

Поиск одного из нескольких слов выполняется при помощи оператора OR или оператора |, который является его полным аналогом. Например, собака OR кошка.

Поиск документов, которые не содержат определенное слово, выполняется при помощи оператора NOT или оператора ~, который является его полным аналогом.

Команды поиска

Помимо обычных запросов поисковая система Апорт поддерживает возможность использования следующих команд.

  • text (<искомые слова>). Искать указанные слова только в содержимом страниц.
  • title (<искомые слова>). Искать указанные слова только в заголовке страниц.
  • keywords (<искомые слова>). Искать указанные слова только в теге <meta name="keywords" content=""> страницы.
  • description (<искомые слова>). Искать указанные слова только в теге <meta name="description" content=""> страницы.
  • alt (<искомые слова>). Искать указанные слова в комментариях к картинкам.
  • anchor (<искомые слова>). Искать указанные слова в тексте ссылок на страницах.
  • url=<имя сайта>. Выполнить поиск только на данном сайте.
  • СЛN (искомые слова). Выполнить поиск всех страниц, на которых искомые слова расположены в пределах N слов друг от друга. Например, при помощи запроса СЛ23 (дизайн программирование структурирование) выполняется поиск всех страниц, на которых искомые слова встречаются на расстоянии не более 23 лишних слов друг от друга.

    Вместо команды СЛN (искомые слова) можно использоваться ее аналоги СN (искомые слова), WN (искомые слова) или [N, искомые слова].

Nigma

Дата создания: 12 апреля 2005 год.
Адрес: HTTP://WWW.NIGMA.RU/ (главная страница),
 HTTP://WWW.NIGMA.RU/INDEX.PHP?VIEW=LITE 
 (только форма поиска).

Данный проект является самым новым из рассмотренных нами поисковых систем, однако он очень быстро набирает популярность. А все потому, что с его помощью можно выполнять поиск сразу по нескольким поисковым системам, рассмотренным нами ранее. А именно, с помощью данного проекта можно выполнять поиск в индексах следующих поисковых систем: Google, Yahoo, Msn, Яндекс, Рамблер, AltaVista, Aport, Nigma (то есть, оказывается у них тоже есть свой собственный индекс страниц Интернета). По умолчанию поиск ведется во всех перечисленных поисковых системах, а результаты такого поиска объединятся между собой.

Правила поиска

Правила поиска в данной поисковой системе являются самыми примитивными из всех, рассмотренных нами ранее. Остается только надеяться, что в будущем будут добавлены новые операторы поиска.

Оператор AND Как вы, наверное, уже догадались, с помощью данного оператора выполняется поиск страниц, которые содержат в себе все слова запроса, объединенные оператором AND.

Вместо оператора AND можно использовать оператор +, так как данный оператор выполняет аналогичные действия. А можно вообще не использовать никаких операторов, так как по умолчанию действие пробела между искомыми словами также аналогично действию оператора AND.

Оператор OR С помощью данного оператора можно найти страницы, которые содержат одно из двух слов (между которыми этот оператор находится).

Оператор - Позволяет исключить из результатов поиска страницы, в которых есть слово, перед которым в поисковом запросе установлен данный оператор. То есть, оператор – аналогичен оператору NOT или ~ других рассмотренных нами поисковых систем.

Оператор site:<имя сайта> Позволяет отобразить лишь страницы, которые принадлежат указанному вами сайту.

Продолжение следует

Рейтинг: 0 
Оцените: 1 2 3 4 5
moemesto.ru bobrdobr.ru - добавить в социальные закладки
В начало записи
Оригинал статьи: http://www.onestyle.com.ua/txt.php?u=783

В избранное