В процессе деятельности любой организации накапливается огромное количество бумажных документов, которое постоянно пополняется все новой и новой бумагой. Архивы организаций растут, безбумажная работа пока несбыточная мечта. Сотрудники компаний каждый день, в зависимости от подразделения и должности, обрабатывают входящие, формируют исходящие и порождают новые документы. Для существенного облегчения их труда и оптимизации работы с массивами документов в повседневной деятельности, все-таки единственной альтернативой становится оцифровка - перевод бумажных документов в электронный вид и последующая работа, по возможности, с цифровыми копиями и информацией в электронном виде. Для этих целей внедряются системы электронного документооборота, электронные архивы, ECM - платформы. Но внедрение современных информационных систем не может обойтись без организации их наполнения электронными данными копиями документов текущих поступлений и ретрофонда, а так же индексной информацией. Поэтому одной из главных задач является создание удобного инструмента для самостоятельного формирования информационных ресурсов в компаниях и учреждениях любого профиля, чтобы обеспечить электронным контентом современные системы управления информацией, а также автоматизация операций ввода данных в системы учета из формализованных бумажных документов.
Что для этого нужно:
Сканирующее оборудование, которое подбирается, исходя из типа и объема обрабатываемых документов, пожеланий и задач компании. Я выделяю три основные группы:
- Высокопроизводительные сканеры для поточной оцифровки расшитой документации
- Универсальные планетарные сканеры для сшитых, ветхих и ценных документов
- Широкоформатные сканеры для карт, планов, схем и чертежей
Профессиональное программное обеспечение (или набор программных средств) для управления процессами оцифровки и пакетной обработки отсканированных образов. Которое обеспечит:
- Консолидацию (импорт) электронных копий с нескольких участков ввода
- Независимое формирование параметров каждого проекта оцифровки.
- Обработка изображений и структурирование по заранее заданным настройкам проекта
- Автоматическая сортировка документов с помощью штрих- и патч-кодов
- Конвертация (создание TIFF, JPEG, PDF файлов, штрих-кодов), сохранение распознанных текстов
- Индексация (в т.ч распознавание текста), верификация, экспорт (коннекторы для ИТ - систем) и публикации результатов, создание систем печати по требованию
Основные возможности типового АРМ центра обработки:
Обработка изображений - начальная обработка изображений должна производится на этапе оцифровки встроенными средствами сканирующего оборудования (доворот, обрезка по формату, удаление пустых страниц, коррекция изгиба). При поступлении электронных образов в центр обработки программные механизмы контроля качества автоматически анализируют параметры изображения. Оператор имеет возможность дополнительной коррекции полученных копий в ручном и автоматическом режиме (устранение перекоса, обрезка, изменение размера, бинаризация, коррекция освещения и ошибок экспозиции, сегментация и т.д.)
Индексирование - создание информационно-поисковой базы данных электронных копий документов. Определяется оптимальный состав извлекаемых индексов - количество полей зависит от задач (от одного индекса до извлечения всей значимой информации). В случае оптического распознавания текста настраиваются гибкие шаблоны для автоматического пакетного извлечения информации по заданным полям с любого типа формализованных документов.
- Ручное индексирование - наполнение индексных полей базы данных с помощью ручного ввода атрибутивной информации при просмотре электронной копии документа
- Оптическое распознавание символов (OCR) - автоматическое извлечение атрибутивной информации с электронной копии документа. Появляется возможность автоматической загрузки реквизитов и графического образа документа в любую систему учета и электронного хранения. При необходимости производится полнотекстовое распознавание для организации поиска по распознанным страницам пакета документов и любым словам в тексте
- Распознавание штрих-кода – при распознавании штрих-кода каждому документу присваивается уникальный идентификатор. По уникальному можно связать электронный образ документа и его атрибутивную информацию в любых системах учета и электронного хранения
Верификация - визуальная проверка качества отсканированных изображений, корректности извлеченной информации и корректировка сомнительных или неверно распознанных данных.
Конвертация - сохранение электронных образов во все популярные форматы, включая TIFF одностраничный и многостраничный, JPG, JPEG2000, PDF одностраничный или многостраничный, PDF/A с возможностью поиска и POD PDF. Записи индексной базы данных формируются в любом необходимом формате.
Подводя итоги можно отметить, что в случае реализации такого решения в организации появятся возможности оперативного сканирования бумажных документов, удобной обработки и индексирования электронных образов. Создание центра оцифровки позволит минимизировать ручной труд и сократить время обработки документов за счет автоматизации процедур индексирования, а также быстро формировать универсальный электронный контент для наполнения любых государственных и коммерческих информационных систем.
Полный обзор на: http://documanagement.livejournal.com/
Это интересно
0
|
|||
Последние откомментированные темы: