Отправляет email-рассылки с помощью сервиса Sendsay
  Все выпуски  

Секреты Windows: статьи о реестре, rundll32.exe, программах


Глава 5. Поиск информации: найдем и перепрячем. Поиск в Интернете: Поиск веб-страниц, Вопросы 16-19
Дата: 2 мая 2010, воскресенье


false.in.ua. Добавлены советы о том, как распознать характер человека по форме его рта и носа.
mycms.com.ua. Добавлено описание темы оформления для CMS Drupal Sports.
onestyle.com.ua. Добавлены статьи:
mydrupal.co.ua. В книгу 'Основы CMS Drupal' добавлены новые разделы:
arts.biz.ua. Добавлен Набор кистей с различными дорожками из пятен и брызг (splatX).
files.biz.ua. Для скачивания доступен Видеоурок по Photoshop: Создаем взрывающийся или сверкающий текст.
gal.co.ua. В галерею КлипАрты добавлены новые изображения:

В конец записи

Вопрос 16. По умолчанию поисковые машины выполняют поиск среди всего содержимого страницы. А мне нужно выполнить поиск только в заголовке страницы. Можно ли это сделать?

Несмотря на то, что поисковые машины по умолчанию выполняют поиск во всем содержимом страницы, вы можете воспользоваться специальными командами, с помощью которых можно конкретизировать область поиска более точным образом.

Поисковая машина Апорт

Для определения области поиска в данной поисковой системе используются поисковые запросы следующего вида.

TEXT (ПОИСКОВЫЙ ЗАПРОС). Искать только в содержимом страниц.
TITLE (ПОИСКОВЫЙ ЗАПРОС). Искать только в заголовке страниц.
KEYWORDS (ПОИСКОВЫЙ ЗАПРОС). Искать только в теге <META NAME="KEYWORDS">.
DESCRIPTION (ПОИСКОВЫЙ ЗАПРОС). Искать только в теге <META NAME="DESCRIPTION">.
ANCHOR (ПОИСКОВЫЙ ЗАПРОС). Искать в тексте ссылок на страницах.
ALT (ПОИСКОВЫЙ ЗАПРОС). Искать в комментариях к картинкам.

Поисковая машина Google

Не забыли о конкретизации области поиска и разработчики поисковой машины Google. Для этого в ней можно использовать следующие ключевые слова.

  • ALLINTEXT:СЛОВА ЧЕРЕЗ ПРОБЕЛ. Искать слова в содержимом страниц (поиск в заголовке страницы и ссылках вестись не будет).
  • INTEXT:СЛОВО. Искать слово в содержимом страниц. Например, запрос ONE DESIGN INTEXT:STYLE отобразит все страницы, в содержимом которых встречается слово «style», а в заголовке, содержимом или в гиперссылках которых встречаются слова «one» и «design».
  • ALLINTITLE:СЛОВА ЧЕРЕЗ ПРОБЕЛ. Искать слова в заголовке страниц. Например, запрос ALLINTITLE:АДМИНИСТРИРОВАНИЕ ПРОГРАММИРОВАНИЕ отобразит все страницы, в заголовке которых присутствуют слова «администрирование» и «программирование».
  • INTITLE:СЛОВО. Искать слово в заголовке страниц. Например, запрос INTITLE:АДМИНИСТРИРОВАНИЕ ПРОГРАММИРОВАНИЕ отобразит все страницы, в заголовке которых присутствует слово «администрирование», а в содержимом или заголовке — слово «программирование».
  • ALLINLINKS:СЛОВА ЧЕРЕЗ ПРОБЕЛ. Искать слова в ссылках на страницах.
  • LINK:АДРЕС. Отобразить все страницы, на которых встречается ссылка на сайт с указанным адресом.

Поисковая машина Яндекс

Также конкретизировать область поиска можно в поисковой машине Яндекс. Для этого в ней применяются специальные команды.

  • $TITLE (ИСКОМЫЕ СЛОВА). Искать в заголовке страниц. Например МАКСВЕЛЛ $TITLE (БИОГРАФИЯ).
  • #KEYWORDS=(ИСКОМЫЕ СЛОВА). Искать в ключевых словах (внутри тега <META NAME="KEYWORDS">).
  • #ABSTRACT=(ИСКОМЫЕ СЛОВА). Искать в описании (внутри тега <META NAME="DESCRIPTION">).
  • #IMAGE="НАЗВАНИЕ". Искать в названии изображений.
  • #HINT=(ИСКОМЫЕ СЛОВА). Искать в подписях к изображениям (в теге ALT).
  • #LINK="ИМЯ САЙТА". Отобразить все страницы, на которых встречается ссылка на сайт с указанным адресом.

Вопрос 17. А можно ли выполнить поиск не в содержимом страниц, а в адресе страниц?

Даже поиск в адресе страниц подвластен современным поисковым машинам. Для этого используются специальные команды различных поисковых машин.

Поисковая машина Апорт

Чтобы с помощью поисковой машины Апорт найти что-то на сайтах, в содержимом которых есть определенное слово, достаточно воспользоваться командой URL=ИМЯ САЙТА.

Поисковая машина Google

Поисковая машина Google поддерживает множество команд для поиска в адресах страниц. Среди них хотелось бы выделить следующие.

  • SITE:АДРЕС. Выполнить поиск на страницах, принадлежащих указанному в команде сайту. Например, запрос ПОИСКОВЫЕ СИСТЕМЫ SITE:WWW.ONESTYLE.COM.UA отобразит все страницы сайта WWW.ONESTYLE.COM.UA, на которых встречаются слова «поисковые» и «системы». Также можно воспользоваться командой наподобие SITE:COM, чтобы выполнить поиск лишь на сайтах, принадлежащих указанному домену.
  • ALLINURL:СЛОВА ЧЕРЕЗ ПРОБЕЛ. Выполнить поиск страниц, адреса которых содержат в себе указанные слова. Например, ALLINURL:ONE STYLE.
  • INURL:СЛОВО. Выполнить поиск страниц, адреса которых содержат указанное слово.

Поисковая машина Яндекс

Также выполнить поиск в адресе можно с помощью поисковой машины Яндекс. Для этого она поддерживает следующие команды.

  • $ANCHOR (ИСКОМЫЕ СЛОВА). Выполнить поиск искомых слов в именах страниц. Например, запрос $ANCHOR (ONE STYLE) отобразит только те страницы, в имени которых встречаются слова «one» и «style».
  • #URL="САЙТ". Выполнить поиск только среди страниц указанного сайта. Например, ПОИСКОВЫЕ СИСТЕМЫ #URL="WWW.ONESTYLE.COM.UA".
  • HOST="САЙТ". Выполнить поиск среди страниц указанного сайта и всех его зеркалах.
  • RHOST="ДОМЕН.САЙТ.*". Выполнить поиск среди страниц указанного сайта и всех его зеркалах. Данный оператор аналогичен оператору host, однако использует другой тип записи имени сайта. Например, RHOST="RU.YANDEX.*".
  • DOMAIN="ДОМЕН". Выполнить поиск среди страниц, которые принадлежат указанному домену. Например, VISTA DOMAIN="RU".

Вопрос 18. Мне нужно найти информацию не на страницах Интернета, а в файлах различных расширений. Например, DOC-файлах. Можно ли это сделать?

Вообще-то сделать это не только просто, а очень просто. Достаточно лишь ввести нужный поисковый запрос, так как по умолчанию поисковые машины ищут не только на страницах Интернета (в файлах формата HTML), но и среди других данных, которые они встречали в Интернете и работать с которыми они умеют.

Если же результатов поискового запроса слишком много, и среди них довольно трудно найти результаты в нужном вам формате, тогда можно воспользоваться специальными командами, сужающими область поиска.

Поисковая машина Google

Для определения типа данных, в которых поисковая машина Google должна искать, применяется команда FILETYPE:РАСШИРЕНИЕ. Поисковая система Google может работать с файлами следующих расширений:

веб-странички (HTM и HTML);
Adobe Portable Document Format (PDF);
Adobe PostScript (PS);
Lotus 1-2-3 (WK1, WK2, WK3, WK4, WK5, WKI, WKS, WKU);
Lotus WordPro (LWP);
MacWrite (MW);
Microsoft Excel (XLS);
Microsoft Word (DOC);
Microsoft PowerPoint (PPT);
Microsoft Works (WKS, WPS, WDB);
Microsoft Write (WRI);
Rich Text Format (RTF);
Shockwave Flash (SWF);
Text (ANS, TXT).

Например, FILETYPE:DOC INURL:WWW.MICROSOFT.COM VISTA.

Поисковая машина Яндекс

Также определять формат файлов, среди которых должен выполняться поиск, может поисковая система Яндекс. Для этого в ней применяется команда #MIME="ТИП ФАЙЛА". Например, VISTA #MIME="DOC".

Если вам нужно выполнить поиск сразу среди файлов нескольких форматов, тогда следует воспользоваться запросом вида (ПОИСКОВЫЙ ЗАПРОС) << (MIME="РАСШИРЕНИЕ" | MIME="РАСШИРЕНИЕ").

Поисковая система Яндекс индексирует содержимое файлов со следующими расширениями: HTML, PDF (Adobe Portable Document Format), DOC (Microsoft Word), PPT (Microsoft PowerPoint), XLS (Microsoft Excel), RTF (Rich Text Format), SWF (Macromedia Flash).

Продолжение следует

Рейтинг: 5.00 [ 1 ] 
Оцените: 1 2 3 4 5
moemesto.ru bobrdobr.ru - добавить в социальные закладки
В начало записи
Оригинал статьи: http://www.onestyle.com.ua/txt.php?u=862

В избранное