Заголовок: Поисковая революция
Компания: SoftInform Ltd
Поисковая революция
Анатолий Егоров
Случалось ли вам отыскивать в дебрях дисковых разделов утерянный документ? Причем,
заметьте себе, жизненно необходимый в данный момент времени? Наверняка вопрос
риторический. При большом желании можно воспользоваться системным инструментом
и попробовать найти информацию по ключевому слову, но вряд ли у вас получится
ввести в крохотное поле поискового запроса фразу из двух-трех предложений. Дело
даже не во времени, затраченном на поиск, а в том, что в системном поисковике
решительно невозможно задать определенный
каталог, где может обретаться искомое. Ко всему прочему, англоязычная Windows
XP напрочь игнорирует мало-мальски сложные словосочетания на русском языке. Об
эффективности подобного решения можно не упоминать - результат ясен изначально.
А что прикажете делать корпоративному сектору, работающему с гигантскими базами
данных и впадающему в ступор при попытке найти очередной "шедевр" бухгалтерской
мысли? Выход давно найден: использование готовых решений на базе поисковых технологий.
Если не брать в расчет область применения таких технологий, то главная задача
- работа с различными источниками информации вкупе с быстрым и точным поиском
в больших массивах данных. Схема работы таких поисковых систем, в первом приближении,
довольно проста: поиск
по фразе с учетом всех синонимов и словоформ.
Однако, в этом случае мы неизбежно столкнемся со скоростью обработки запроса
и выдачи готового результата. Дело в том, что поиск по нескольким словам или
крохотной фразе никогда не даст точной картины по найденным документам. А поиск
по длиннющей фразе (например, в половину документа) в существующих приложениях
занимает слишком много времени и весьма привередлив к ресурсам компьютера. В
итоге получается своеобразная дилемма: при хорошей скорости ``хромает'' качество
поиска; при точных и адекватных результатах
понадобится уйма времени и системно-аппаратных ресурсов. Радует, что не так давно
нашелся выход из этого тупика.
Российская линейка продуктов SearchInform 1.0.20 (www.searchinform.com) окажется
незаменимой в любом секторе, будь то корпоративная сеть предприятия или простой
домашний компьютер. Главная задача поисковиков SearchInform - поиск текстовой
информации. Фирменная технология позволяет работать с различными источниками
информации, каковая может содержаться не только в файловых форматах (включая
PDF, HTM и HTML), но и в базах данных большинства распространенных информационных
систем (Access, MS SQL, Oracle, а также
любых СУБД, поддерживающих SQL). Для вящей конкретизации поиска наличествует
функция использования списков синонимов и выделения т.н. ``важных слов''. Не
забыта разработчиками и поддержка индексации с последующим поиском в электронной
корреспонденции. Программа умеет обрабатывать почту в форматах MS Outlook и MS
Outlook Express. Причем, SearchInform индексирует не только текст сообщения,
но и вложенные файлы (поддержка таких популярных почтовых клиентов, как The
Bat и Eudora ожидается в самое ближайшее время).
Таким образом, решается проблема поиска нужных писем среди тысяч сообщений в
корпоративном ворохе корреспонденции.
Казалось бы, что еще можно придумать в области поисковых технологий, в особенности,
при наличии довольно функциональных готовых решений? Ан нет - главным козырем
SearchInform является очень высокая скорость работы и принципиально новый подход
к поиску информации. Если эффективность использования SearchInform может быть
не столь заметна при относительно небольших объемах информации, то поиск в базе
с размером более 1 Гб будет очень ощутимым. Например, индексация около ста тысяч
(!) документов общим объемом
1,3 Гб занимает чуть менее 25 минут. И это на рядовом (по нынешним меркам) домашнем
компьютере.
Еще одна фирменная технология - Smart Indexing - позволяет в режиме реального
времени отслеживать нагрузку на процессор компьютера и регулировать уровень потребления
системных ресурсов при индексации посредством SearchInform 1.0.20. Однако, при
необходимости продолжения работы в других приложениях, можно гибко настроить
поисковый движок и добиться компромисса между скоростью индексации и нагрузкой
на системные ресурсы.
Высокая скорость индексирования (до 6 Гб/час), малый размер индекса (15-20% от
реального объема текстовой информации), поддержка практически всех распространенных
форматов текстовых файлов (включая *PDF и *HTML) и корректная работа с архивами
делают SearchInform незаменимым инструментом поиска информации.
Контактная информация:
------------------------------
Контактное лицо: Анатолий Егоров
PR-manager
E-mail: egor62@bk.ru
Телефон: +7 37250 82952