Секреты Windows: статьи о реестре, rundll32.exe, программах
Глава 5. Поиск информации: найдем и перепрячем. Поиск в Интернете: Поиск веб-страниц, Вопросы 16-19 Дата: 2 мая 2010, воскресенье
false.in.ua. Добавлены советы о том, как распознать характер человека по форме его рта и носа.
mycms.com.ua. Добавлено описание темы оформления для CMS Drupal Sports.
onestyle.com.ua. Добавлены статьи:
Вопрос 16. По умолчанию поисковые машины выполняют поиск среди всего содержимого страницы. А мне нужно выполнить поиск только в заголовке страницы. Можно ли это сделать?
Несмотря на то, что поисковые машины по умолчанию выполняют поиск во всем содержимом страницы, вы можете воспользоваться специальными командами, с помощью которых можно конкретизировать область поиска более точным образом.
Поисковая машина Апорт
Для определения области поиска в данной поисковой системе используются поисковые запросы следующего вида.
TEXT (ПОИСКОВЫЙ ЗАПРОС). Искать только в содержимом страниц.
TITLE (ПОИСКОВЫЙ ЗАПРОС). Искать только в заголовке страниц.
KEYWORDS (ПОИСКОВЫЙ ЗАПРОС). Искать только в теге <META NAME="KEYWORDS">.
DESCRIPTION (ПОИСКОВЫЙ ЗАПРОС). Искать только в теге <META NAME="DESCRIPTION">.
ANCHOR (ПОИСКОВЫЙ ЗАПРОС). Искать в тексте ссылок на страницах.
ALT (ПОИСКОВЫЙ ЗАПРОС). Искать в комментариях к картинкам.
Поисковая машина Google
Не забыли о конкретизации области поиска и разработчики поисковой машины Google. Для этого в ней можно использовать следующие ключевые слова.
ALLINTEXT:СЛОВА ЧЕРЕЗ ПРОБЕЛ. Искать слова в содержимом страниц (поиск в заголовке страницы и ссылках вестись не будет).
INTEXT:СЛОВО. Искать слово в содержимом страниц. Например, запрос ONE DESIGN INTEXT:STYLE отобразит все страницы, в содержимом которых встречается слово «style», а в заголовке, содержимом или в гиперссылках которых встречаются слова «one» и «design».
ALLINTITLE:СЛОВА ЧЕРЕЗ ПРОБЕЛ. Искать слова в заголовке страниц. Например, запрос ALLINTITLE:АДМИНИСТРИРОВАНИЕ ПРОГРАММИРОВАНИЕ отобразит все страницы, в заголовке которых присутствуют слова «администрирование» и «программирование».
INTITLE:СЛОВО. Искать слово в заголовке страниц. Например, запрос INTITLE:АДМИНИСТРИРОВАНИЕ ПРОГРАММИРОВАНИЕ отобразит все страницы, в заголовке которых присутствует слово «администрирование», а в содержимом или заголовке — слово «программирование».
ALLINLINKS:СЛОВА ЧЕРЕЗ ПРОБЕЛ. Искать слова в ссылках на страницах.
LINK:АДРЕС. Отобразить все страницы, на которых встречается ссылка на сайт с указанным адресом.
Поисковая машина Яндекс
Также конкретизировать область поиска можно в поисковой машине Яндекс. Для этого в ней применяются специальные команды.
$TITLE (ИСКОМЫЕ СЛОВА). Искать в заголовке страниц. Например МАКСВЕЛЛ $TITLE (БИОГРАФИЯ).
#KEYWORDS=(ИСКОМЫЕ СЛОВА). Искать в ключевых словах (внутри тега <META NAME="KEYWORDS">).
#ABSTRACT=(ИСКОМЫЕ СЛОВА). Искать в описании (внутри тега <META NAME="DESCRIPTION">).
#IMAGE="НАЗВАНИЕ". Искать в названии изображений.
#HINT=(ИСКОМЫЕ СЛОВА). Искать в подписях к изображениям (в теге ALT).
#LINK="ИМЯ САЙТА". Отобразить все страницы, на которых встречается ссылка на сайт с указанным адресом.
Вопрос 17. А можно ли выполнить поиск не в содержимом страниц, а в адресе страниц?
Даже поиск в адресе страниц подвластен современным поисковым машинам. Для этого используются специальные команды различных поисковых машин.
Поисковая машина Апорт
Чтобы с помощью поисковой машины Апорт найти что-то на сайтах, в содержимом которых есть определенное слово, достаточно воспользоваться командой URL=ИМЯ САЙТА.
Поисковая машина Google
Поисковая машина Google поддерживает множество команд для поиска в адресах страниц. Среди них хотелось бы выделить следующие.
SITE:АДРЕС. Выполнить поиск на страницах, принадлежащих указанному в команде сайту. Например, запрос ПОИСКОВЫЕ СИСТЕМЫ SITE:WWW.ONESTYLE.COM.UA отобразит все страницы сайта WWW.ONESTYLE.COM.UA, на которых встречаются слова «поисковые» и «системы». Также можно воспользоваться командой наподобие SITE:COM, чтобы выполнить поиск лишь на сайтах, принадлежащих указанному домену.
ALLINURL:СЛОВА ЧЕРЕЗ ПРОБЕЛ. Выполнить поиск страниц, адреса которых содержат в себе указанные слова. Например, ALLINURL:ONE STYLE.
INURL:СЛОВО. Выполнить поиск страниц, адреса которых содержат указанное слово.
Поисковая машина Яндекс
Также выполнить поиск в адресе можно с помощью поисковой машины Яндекс. Для этого она поддерживает следующие команды.
$ANCHOR (ИСКОМЫЕ СЛОВА). Выполнить поиск искомых слов в именах страниц. Например, запрос $ANCHOR (ONE STYLE) отобразит только те страницы, в имени которых встречаются слова «one» и «style».
#URL="САЙТ". Выполнить поиск только среди страниц указанного сайта. Например, ПОИСКОВЫЕ СИСТЕМЫ #URL="WWW.ONESTYLE.COM.UA".
HOST="САЙТ". Выполнить поиск среди страниц указанного сайта и всех его зеркалах.
RHOST="ДОМЕН.САЙТ.*". Выполнить поиск среди страниц указанного сайта и всех его зеркалах. Данный оператор аналогичен оператору host, однако использует другой тип записи имени сайта. Например, RHOST="RU.YANDEX.*".
DOMAIN="ДОМЕН". Выполнить поиск среди страниц, которые принадлежат указанному домену. Например, VISTA DOMAIN="RU".
Вопрос 18. Мне нужно найти информацию не на страницах Интернета, а в файлах различных расширений. Например, DOC-файлах. Можно ли это сделать?
Вообще-то сделать это не только просто, а очень просто. Достаточно лишь ввести нужный поисковый запрос, так как по умолчанию поисковые машины ищут не только на страницах Интернета (в файлах формата HTML), но и среди других данных, которые они встречали в Интернете и работать с которыми они умеют.
Если же результатов поискового запроса слишком много, и среди них довольно трудно найти результаты в нужном вам формате, тогда можно воспользоваться специальными командами, сужающими область поиска.
Поисковая машина Google
Для определения типа данных, в которых поисковая машина Google должна искать, применяется команда FILETYPE:РАСШИРЕНИЕ. Поисковая система Google может работать с файлами следующих расширений:
веб-странички (HTM и HTML);
Adobe Portable Document Format (PDF);
Adobe PostScript (PS);
Lotus 1-2-3 (WK1, WK2, WK3, WK4, WK5, WKI, WKS, WKU);
Lotus WordPro (LWP);
MacWrite (MW);
Microsoft Excel (XLS);
Microsoft Word (DOC);
Microsoft PowerPoint (PPT);
Microsoft Works (WKS, WPS, WDB);
Microsoft Write (WRI);
Rich Text Format (RTF);
Shockwave Flash (SWF);
Text (ANS, TXT).
Например, FILETYPE:DOC INURL:WWW.MICROSOFT.COM VISTA.
Поисковая машина Яндекс
Также определять формат файлов, среди которых должен выполняться поиск, может поисковая система Яндекс. Для этого в ней применяется команда #MIME="ТИП ФАЙЛА". Например, VISTA #MIME="DOC".
Если вам нужно выполнить поиск сразу среди файлов нескольких форматов, тогда следует воспользоваться запросом вида (ПОИСКОВЫЙ ЗАПРОС) << (MIME="РАСШИРЕНИЕ" | MIME="РАСШИРЕНИЕ").
Поисковая система Яндекс индексирует содержимое файлов со следующими расширениями: HTML, PDF (Adobe Portable Document Format), DOC (Microsoft Word), PPT (Microsoft PowerPoint), XLS (Microsoft Excel), RTF (Rich Text Format), SWF (Macromedia Flash).