Рассылка закрыта
При закрытии подписчики были переданы в рассылку "Всё о работе в Интернет" на которую и рекомендуем вам подписаться.
Вы можете найти рассылки сходной тематики в Каталоге рассылок.
Секреты Windows: статьи о реестре, rundll32.exe, программах
Глава 5. Поиск информации: найдем и перепрячем. Поиск в Интернете: Поиск веб-страниц, Вопрос 11. Так как же все-таки искать среди страниц Интернета? У вас возникли вопросы по Windows? Задайте их нам на Форуме (http://www.onestyle.com.ua/q.php). Вам достаточно просто зарегистрироваться!
false.in.ua. Добавлены советы о том, как распознать характер человека по строению его лба. mycms.com.ua. Добавлено описание темы оформления для CMS Drupal Painted. onestyle.com.ua. Добавлены статьи: mydrupal.co.ua. В книгу 'Основы CMS Drupal' добавлены новые разделы: arts.biz.ua. Добавлен Набор кистей с изображением теней и туманностей (Shadow3). files.biz.ua. Для скачивания доступен Видеоурок по Photoshop: Изменяем цвет глаз. gal.co.ua. В галерею КлипАрты добавлены новые изображения: Поиск в Интернете — нелегкая задача. Он выполняется с помощью специализированных сайтов. Такие сайты могут выполнять поиск различной информации: веб-страниц по их содержимому, страниц по категориям, изображений, мультимедиа файлов, людей, и многого другого. Поэтому для упрощения давайте разделим наш рассказ о поиске в Интернете по категориям. Поиск информации на страницах Интернета — самая древняя категория поиска из всех существующих. За многие годы существования механизм поиска в этой области был существенно переработан и улучшен. На данный момент практически все поисковые системы выполняют морфологический поиск информации. То есть, могут искать не только строго введенную вами фразу, но и различные склонения этой фразы: множественное и единственное число, склонения по падежам и др. Поиском информации на страницах Интернета занимается множество сайтов (их называют поисковыми машинами), но популярными из них считаются единицы. К этим единицам можно отнести следующие поисковые машины.
Начать поиск очень просто. Достаточно зайти на любую из описанных выше поисковых машин и ввести искомую фразу. Если искомая вами фраза проста или вообще состоит из одного слова, тогда ввода фразы будет достаточно для правильного поиска. В более сложных ситуациях придется учитывать особенности конкретной поисковой машины. Есть, правда, несколько правил, которые поддерживают все поисковые машины. Например, к такому правилу относится то, что все поисковые машины удаляют из своих баз данных электронные адреса. Поэтому при всем своем желании, ни одного email-адреса с помощью поисковых систем вы не найдете. Сделано это для того, чтобы не облегчать работу спамерам. Поисковая машина GoogleДля ускорения поиска поисковая машина Google фильтрует (удаляет из поискового запроса) знаки препинания, а также восклицательный, вопросительный знаки, слеши, знак @ и другие знаки, не относящиеся к символьно-цифровым. Поэтому пользуясь данной поисковой машиной, об этих символах можете забыть. Хотя, в некоторых случаях об этом можно и не забывать. Например, несмотря на фильтрацию Google сможет найти страницы по запросам C++ или $10. Такие запросы считаются запросами-исключениями и не фильтруются. По умолчанию поисковый запрос, состоящий из нескольких слов, выполняет поиск всех веб-страниц, в содержимом которых есть все слова, введенные вами в запросе. На машинном языке ваш запрос преобразуется в запрос вида <ИСКОМОЕ СЛОВО 1> AND <ИСКОМОЕ СЛОВО 2> AND …. Вы и сами можете пользоваться оператором AND вместо пробела между словами запроса, хотя намного проще пользоваться именно пробелами. Помимо оператора AND в поисковом запросе можно использовать другой оператор — оператор OR. Он ставится между двумя словами и говорит о том, что поисковая машина должна найти все страницы Интернета, на которых если либо первое указанное вами слово, либо второе. По умолчанию Google фильтрует из поискового запроса отдельные буквы, цифры, а также незначащие слова (предлоги, частицы и артикли, например, ГДЕ, КАК, THE, WHO, AND и другие). Однако фильтрация выполняться не будет, если поисковый запрос состоит только из незначащих слов (например, поисковый запрос THE WHO). Кроме того, вы можете вручную сказать системе, что она не должна фильтровать определенное незначащее слово в поисковом запросе. Для этого достаточно поставить перед незначащим словом символ +. Если в поисковом запросе много нужных незначащих слов, тогда для отключения фильтрации всех их, можно взять поисковый запрос в кавычки. Например, "THE SOUND AND THE FURY". Вообще, кавычки говорят о том, что поисковая машина должна выполнить поиск фразы как есть. То есть, со всеми незначащими словами. И, к тому же, именно поиск фразы, а не слов из фразы. Например, поисковый запрос "ЗВЕЗДНЫЕ ВОЙНЫ" найдет все страницы Интернета, на которых встречается фраза «звездные войны». Тогда как поисковый запрос ЗВЕЗДНЫЕ ВОЙНЫ найдет все страницы Интернета, на которых встречаются слова «звездные» и «войны». Даже для запросов, которые не взяты в кавычки, поисковая машина сначала старается отобразить все страницы Интернета, которые точно соответствуют введенному запросу, и лишь потом те страницы, на которых просто встречаются все слова из запроса. Например, для запроса Звездные войны поисковая машина сначала отобразит все страницы, на которых встречается фраза «звездные войны», после чего отобразит все страницы, на которых есть слова «звездные» и «войны». Поисковая машина Google поддерживает в поисковых запросах знак подстановки *. Данный символ говорит об одном или нескольких словах, которые могут разделять одну часть искомого запроса от другой. Поисковая машина ЯндексПравила поиска нескольких слов с помощью поисковой системы Яндекс немножко отличаются от правил поиска с помощью других поисковых систем. Данная поисковая машина отображает все страницы Интернета, в которых есть все введенные в запросе слова. При этом все слова должны находиться в пределах нескольких предложений друг от друга. Причем, порядок слов на странице Интернета не имеет никакого значения. Если нужно выполнить поиск страниц, в которых слова поискового запроса встречаются в пределах всей страницы (а не только в пределах нескольких предложений друг от друга), тогда следует поставить между словами символы && или символы <<. А можно выполнить поиск еще конкретнее — самостоятельно указать количество предложений, в пределах которых должны находиться искомые слова. Для этого используются символы вида &&/<максимальное количество предложений>. Например, КУЛЬТУРА &&/2 РОССИЯ. Символы << отличаются от символов && тем, что при их использовании слово, которое находится справа от оператора <<, не будет влиять на ранжирование страниц результатов запроса. Если же вам нужно сузить область поиска, тогда можно воспользоваться оператором &. Он позволяет искать страницы, в которых слова запроса встречаются в одном предложении. Например, КУЛЬТУРА & РОССИЯ. Для еще большего сужения области поиска следует использовать оператор /<МАКСИМАЛЬНОЕ КОЛИЧЕСТВО СЛОВ>. Он позволяет указать максимальное количество слов, которые могут находиться между двумя словами запроса. А оператор вида /(<МИНИМАЛЬНОЕ КОЛИЧЕСТВО СЛОВ> <МАКСИМАЛЬНОЕ КОЛИЧЕСТВО СЛОВ>) позволяет указать не только максимальное количество слов, которые могут находиться между двумя словами запроса, но и минимальное их количество. И самое большое сужение области поиска — поиск по фразе. Как и в поисковой машине Google, в Яндексе для этого достаточно взять фразу в кавычки. Порядок слов Как было сказано выше, по умолчанию поисковая машина Яндекс не обращает внимания на порядок слов в поисковом запросе. Если же порядок слов для вас важен, можно воспользоваться символами + или -. Если между словами запроса поставить символ +, тогда будут отображены только те страницы, на которых данные слова находятся в прямом порядке (так, как вы ввели их в запросе). При использовании символа – будет выполняться поиск слов в обратном порядке. Например, ПИСАТЕЛЬ ЛЕВ + ТОЛСТОЙ. Операторы порядка слов могут использоваться вместе с операторами сужения области поиска. Для этого достаточно поставить оператор порядка слова перед числом в операторе сужения поиска. Например, чтобы скомбинировать оператор порядка + и оператор сужения /<ЧИСЛО>, достаточно воспользоваться оператором /+<ЧИСЛО>. Логические операторы Как и поисковая система Google, поисковая система Яндекс поддерживает логические операторы. По умолчанию используется оператор сложения слов, но вы можете использовать другие операторы.
Настройка морфологии По умолчанию поисковая машина Яндекс выполняет морфологический поиск. Если же вам необходимо выполнить поиск именно по слову в указанном вами падеже и числе, тогда следует поставить символ ! перед искомым словом. Еще один оператор настройки морфологии — !!. С его помощью можно выполнить поиск по слову в нормальной форме. Например, запрос !!ДЕНЬ найдет все формы данного слова («дня», «дню», «днем» и т.д.), но не найдет форм слова «деть». Правила релевантности Поисковая система Яндекс позволяет изменять релевантность отдельных слов в поисковом запросе. Подробнее об этом и коэффициенте мягкости можно прочитать на странице HTTP://COMPANY.YANDEX.RU/ARTICLES/ROMIP2004.XML. Поисковая машина РамблерОсобенность поиска с помощью данной поисковой машины заключается в том, что она позволяет искать с учетом знаков препинания. А вот незначащие слова фильтруются, как и в других поисковых машинах. Если же нужно выполнить поиск с учетом незначащих слов, тогда искомую фразу нужно взять в двойные кавычки. Следует только учесть, что для фразы, взятой в двойные кавычки, морфологический поиск не выполняется. Также следует не забывать, что поисковая система Рамблер может выполнять поиск с учетом морфологии только для русского и английского языка. По умолчанию Рамблер игнорирует регистр слов поискового запроса. Тем не менее, от регистра слов иногда зависит метод поиска, используемый поисковой машиной. По умолчанию поисковая система ищет страницы, в которых между словами запроса находится не более 40 слов. Если поисковый запрос состоит из 2-4 слов, каждое из которых написано с прописной буквы, тогда максимально возможное расстояние между словами запроса не будет превышать одного слова. Но вы можете и вручную указать область поиска. Для этого достаточно воспользоваться запросом вида (число, запрос), где число определяет максимальное количество лишних слов, которые могут находиться между словами запроса. Как и другие поисковые машины, Рамблер поддерживает логические операторы в поисковых запросах.
Поисковая машина АпортДанная поисковая система поддерживает поиск с учетом морфологии и игнорирует незначащие слова. Отменить игнорирование незначащих слов можно с помощью взятия поисковой фразы в кавычки. Она поддерживает логические операторы AND (или &), OR (или |) и NOT (или ~). Поисковая машина Апорт поддерживает возможность поиска страниц, на которых искомые слова расположены в пределах определенного количества слов друг от друга. Для этого достаточно воспользоваться поисковым запросом вида СЛ№ (ИСКОМЫЕ СЛОВА), где № определяет количество лишних слов, которые могут находиться между искомыми словами. Например, СЛ23 (АДМИНИСТРИРОВАНИЕ ПРОГРАММИРОВАНИЕ). Помимо запроса СЛN (ИСКОМЫЕ СЛОВА) можно использоваться его аналоги СN (ИСКОМЫЕ СЛОВА), WN (ИСКОМЫЕ СЛОВА) или [N, ИСКОМЫЕ СЛОВА]. Продолжение следует Рейтинг: 5.00 [ 1 ]
Оцените: 1 2 3 4 5 moemesto.ru bobrdobr.ru
- добавить в социальные закладки
В начало записиОригинал статьи: http://www.onestyle.com.ua/txt.php?u=860
|
В избранное | ||