Отправляет email-рассылки с помощью сервиса Sendsay
  Все выпуски  

Секреты Windows: статьи о реестре, rundll32.exe, программах


Глава 5. Поиск информации. Поиск информации в Интернете - Яндекс, Правила поиска
Дата: 10 февраля 2010, среда

Полезные ссылки

"Журнал Эффективная работа на компьютере"- компьютер для начинающих.
Бесплатный Журнал Эффективная работа на компьютере. Научитесь грамотно работать с полезными и нужными утилитами, узнайте что-то новое для себя из авторских статей. Ни на одном форуме вам не расскажут, того что могу дать вам я. Ведь видеоматериал усваивается человеком в несколько раз лучше, чем обычный печатный текст. В статьях и уроках используется мой личный опыт, а не пустая переписка текстов с сайтов, которая возможно даже не работает! Прежде чем что-то сообщить, я проверяю действие тех или иных программ и методов, выявляю их эффективность. И только после этого преподношу это вам.

С уважением Артём Ющенко.

Адрес сайта http://artomu.com
E-mail: admin@artomu.com

Новинки нашей сети


http://myauto.co.ua. В словарь добавлены новые термины, касающиеся характеристик и устройства двигателя внутреннего сгорания.
http://card.co.ua. Добавлена игра на Flash Дурак простой и дурак переводной (2-4 участника)
http://hand.co.ua. Добавлено описание массажного приема Поколачивание.
http://words.co.ua. Добавлены новые слова.
false.in.ua/node/113. В галерею Нос добавлены изображения возможных форм носа, а также характеристики людей с такими формами.

В конец записи

Дата создания: 1997 год.
Адрес: HTTP://WWW.YANDEX.RU (полная версия), HTTP://WWW.YA.RU/
 (только поле поиска), HTTP://DZEN.YANDEX.RU/
 (только кнопка поиска, для случайного поиска) и т.д.

Если вам нужно выполнить поиск страниц на русском языке, тогда лучше всего воспользоваться поисковой системой Яndex. Уже сейчас данная поисковая система считается одной из лучших поисковых систем для поиска страниц на русском и английском языках.

Особенностью данной системы является полная поддержка всех правил морфологии русского языка (поддержка правил морфологии русского языка есть и у поисковой системы Google, однако на данный момент она не может похвастаться полнотой и правильностью работы). То есть, вам не нужно задумываться над тем, в какой форме или падеже указывать искомое слово. Например, если вы выполните поиск по слову компьютер, тогда поисковая система отобразит перед вами все страницы, на которых встречаются слова компьютер, компьютера, компьютеры и т.д.

С технической точки зрения данная поисковая система работает следующим образом. Поисковый робот просматривает страницу и составляет предварительный индекс ее содержимого. После этого выполняется приведение всех русских слов в нормальную форму (например, для существительных это именительный падеж единственного числа, а для глаголов — неопределенная форма), определение их расположения на странице, а также определение их характеристик. Все полученные таким образом данные заносятся в базу данных индексированных страниц. Благодаря тому, что перед индексацией слова переводятся в нормальную форму, достигается сокращение размера базы данных индекса на 30%.

По умолчанию запрос, состоящий из нескольких слов, трактуется следующим образом: найти все страницы, которые содержат слова запроса, расположенные недалеко друг от друга. При этом не учитывается фактическое расположение слов поискового запроса. Например, запрос красная шапочка приведет к отображению всех страниц, в которых слово красная и слово шапочка находятся в пределах нескольких предложений, причем совершенно неважно, какое из этих слов будет идти первым.

Расстояние между словами Если же нужно еще больше расширить область поиска и выполнить поиск страниц, в которых введенные вами слова встречаются в пределах всей страницы, тогда следует поставить между словами искомой фразы символы &&.

Вместо оператора && можно воспользоваться оператором <<. Данный оператор также расширяет область поиска, и выполняет поиск страниц, в которых введенные вами слова встречаются в пределах всей страницы. Однако при этом слово, которое находится справа от оператора <<, не будет влиять на ранжирование страниц результатов запроса.

Вы можете точно определить максимальное количество предложений, которые могут отделять одно искомое слово от другого. Для этого между словами вашего запроса нужно поставить структуру вида &&/максимальное_количество_слов. Например, по запросу культура &&/2 Россия отобразятся все страницы, в которых слово Россия отделяется от слова культура не более чем двумя предложениями.

Также поисковая система позволяет искать страницы, в которых введенные вами слова встречаются в одном предложении. Для этого достаточно поставить между словами искомой фразы символы &. Например, по запросу культура & Россия отобразятся все страницы, содержащие в одном предложении и слово культура и слово Россия.

Более того, вы можете точно определить максимальное количество слов, которые могут отделять одно искомое слово от другого. Для этого между словами вашего запроса нужно поставить оператор /максимальное_количество_слов. Например, по запросу культура /2 Россия отобразятся все страницы, в которых слово Россия отделяется от слова культура не более чем одним словом.

Усложняя задачу можно прийти к еще одному виду операторов поисковой системы Яндекс: /(минимальное_количество_слов максимальное_количество_слов). С помощью такого оператора выполняется поиск фраз, в которых между словами может находиться не более определенного количество слов и не менее другого такого же определенного количества слов. Например, запрос космическая /(2 3) станция найдет страницы, на которых могут присутствовать фразы вида космическая орбитальная станция, космическая российская орбитальная станция, но при этом не будут найдены страницы, на которых находятся фразы вида космическая станция.

Если же вы хотите выполнить поиск по жесткой фразе (то есть, найти страницы, содержащие точную фразу, которая совпадает с введенной вами), тогда следует взять искомую фразу в кавычки. Например, "красная шапочка".

Порядок слов Если для вашего запроса важен порядок расположения слов искомой фразы, тогда при его создании следует воспользоваться несколькими дополнительными возможностями поисковой системы Яндекс.

Так, чтобы найти слова, которые идут в определенном порядке, достаточно поставить между ними знак + (в прямом порядке) или – (в обратном порядке). Например, при запросе Иван + Тургенев будут найдены все страницы, содержащие в себе фразы вида Иван Тургенев и ни одной страницы, содержащей в себе фразы вида Тургенев Иван.

Одной из особенностей поисковой системы Яндекс является возможность объединения операторов изменения расстояния между словами и операторов изменения порядка слов. Для этого достаточно поставить оператор порядка слов после знака / операторов изменения расстояния между словами. Например, давайте немножко усложним наш предыдущий запрос: Иван /+2 Тургенев. С его помощью будут найдены все страницы, в которых между словом Иван и словом Тургенев находится одно слово. Причем, слово Иван всегда должно стоять перед словом Тургенев.

А теперь взгляните на еще один запрос: Васисуалий /(-1 +2) Лоханкин. Данный запрос отобразит перед вами только те страницы, которые содержат в себе одну из фраз следующего вида:

Лоханкин Васисуалий;
Васисуалий Лоханкин;
Васисуалий слово Лоханкин.

Логические операторы Поисковая система Яндекс способна обрабатывать логические операторы типа ИЛИ и НЕ.

Так, для того, что выполнить поиск ИЛИ слова1 ИЛИ слова2, нужно поставить между искомыми словами знак |. Например, по поисковому запросу отпуск Лондон | Париж будут отображены все страницы, в которых встречаются слова отпуск Лондон или отпуск Париж.

Если же нужно найти все страницы, на которых нет определенного слова, тогда следует перед этим словом поставить оператор ~~. Например, запрос компьютерный журнал ~~CHIP отобразит все страницы, на которых встречаются слова компьютерный и журнал, но нет слова CHIP.

Кроме того, поисковая система Яндекс поддерживает еще одну разновидность логического оператора НЕ. Вы можете выполнить поиск страниц, в которых определенного слова нет в том же предложении, что и других слов запроса, однако оно может встречаться в других предложениях страницы. Для этого предназначен оператор ~.

Настройка морфологии По умолчанию поиск всех слов, которые вы указываете, выполняется с учетом морфологии. Если же необходимо выполнить поиск без использования морфологии, тогда следует поставить перед искомым словом символ !. Например, поиск по фразе !день отобразит все страницы, на которых присутствует слово день. Такие же страницы, на которых встречаются слова дня, дней, дни (а также деть, денешь и т.д., ведь слово день является и одной из форм слова деть) в результаты поиска не попадут.

Одной из проблем поиска с учетом морфологии является то, что формы некоторых слов могут совпадать. Например, форма день слова день и форма день слова деть. Чтобы решить эту проблему, достаточно указать поиск по слову в нормальной форме. Для этого достаточно поставить перед словом, расположенным в нормальной форме, оператор !!. Например, запрос !!день найдет все формы данного слова (дня, дню, днем и т.д.), и не найдет форм слова деть.

Зависимости между фразами Мы с вами рассмотрели способы установления зависимостей между отдельными словами, однако помимо этого вы можете устанавливать зависимости между целыми фразами либо даже между зависимостями слов (зависимости зависимостей, в общем, это что-то страшное). Делать это не сложно — достаточно взять отдельную фразу в круглые скобки.

В качестве примера давайте рассмотрим такой запрос: мумие && (лечение | лечебный | болезни)~~(цена | прайс | рубли | доллар | фирма | магазин). По данному запросу будут найдены все страницы, на которых присутствует слово мумие, а также одно из слов, символизирующих его лечебные качества. При этом, на страницах не должно быть слов, связанных с покупкой этого предмета.

Изменение правил релевантности Еще одной интересной возможностью поисковой системы Яндекс является возможность изменения релевантности отдельных слов в поисковом запросе.

Так, чтобы изменить вес отдельного слова, нужно поставить после него оператор :вес. Например, запрос поисковые механизмы:5 говорит о том, что на результирующих страницах более важно слово механизмы, а не слово поисковые.

Также поисковая система позволяет определить уровень нестрогого поиска (коэффициент «мягкости»). То есть, вы можете определить, будут ли в результаты поиска включаться страницы, которые содержат не все из тех слов, которые вы указали в запросе (пассажи). Для этого предназначены запросы вида (слова через пробел)//число_от_1_до_100. По умолчанию поиск ведется с коэффициентом мягкости, равным 6.

При коэффициенте мягкости, равном 50, число найденных документов должно быть примерно средним геометрическим чисел найденных документов при поиске всех возможных неполных пассажей. Подробнее о коэффициенте мягкости можно прочитать на странице HTTP://COMPANY.YANDEX.RU/ARTICLES/ROMIP2004.XML.

Продолжение следует

Рейтинг: 5.00 [ 1 ] 
Оцените: 1 2 3 4 5
moemesto.ru bobrdobr.ru - добавить в социальные закладки
В начало записи
Оригинал статьи: http://www.onestyle.com.ua/txt.php?u=781

В избранное