Большинством пользователей PDFвоспринимается как удобный формат для просмотра документов, не более того, поэтому в СЭД должно быть встроено средство просмотра – этим все функциональные требования в отношении работы с PDF-файлами ограничиваются.
Еще принято считать, что PDF – это нередактируемый формат, поэтому в нем можно сохранять и распространять финальные версии документов. Данное заблуждение укоренилось со времен, когда формат был закрытым и для создания PDF-документов нужно было покупать полную версию AdobeAcrobat, а для просмотра был доступен только ArcobatReader. Это уже давно не так: наберите в поиске “PDFeditor” – и вы удивитесь разнообразию средств создания и редактирования PDF, в том числе opensource.
Но не спешите бить тревогу и срочно искать замену PDF: этот формат обладает гораздо большим потенциалом для различных сценариев использования в документообороте, чем вы привыкли думать.
PDFв контексте СЭД/ECM
Для применения PDFв СЭД могут быть интересны следующие его возможности:
Многослойность: в один файл, в разные слои помещается сканированный образ документа и распознанный текст, причем каждый фрагмент текста, каждое слово сохраняет привязку к координатам в графическом слое. Это позволяет использовать полнотекстовый поиск – на самом деле поиск происходит в тексте, а на экране пользователь видит сканированный образ с подсвеченными термами из запроса.
Аннотирование и комментирование: при согласовании документов всем участникам рассылается не Word'овый файл, а PDF, в котором они могут оставлять свои замечания, можно также в разных слоях, чтобы не видеть замечаний друг друга (если это необходимо). Учитывая распространенность iOS-устройств, ноутбуков и планшетов, особенно среди руководителей, это гораздо удобнее.
PDF-книга: некоторые приложения умеют компоновать отдельные документов (любых форматов) в один файл, снабжая его титульным листом, оглавлением и сплошной нумерацией. Это востребовано, например, при подготовке к совещаниям — повестка и материалы по всем вопросам легче рассылать на ознакомление в виде одного файла. Также один файл проще печатать, когда людям нужна бумажная копия.
PDF-формы: вне конкуренции, когда требуется собрать данные от заявителей или клиентов. В отличие от банальных HTML-форм, когда вся ранее введенная информация пропадает при сбое, даже не до конца заполненную PDF-форму можно сохранить и вернуться к ней позже, когда данные у вас будут все необходимые данные. В действии эту технологию можно видеть, например, на сайте визового центра Великобритании.
Чтение документов — отнюдь не тривиальная задача
С документами, содержащими два-три листа проблем нет, их все равно как читать — в простом текстовом формате, в виде скана, в Word'е, в PDF. Другое дело, когда в документе 50, 100, 300 страниц. За один раз столько не прочитать, человек вынужден останавливаться.
Читая книгу (в бумаге или на iPad), мы обычно делаем закладки — чтобы вернуться к интересующему месту. Почему же не сделать эту функцию для пользователей СЭД? С PDF-документами это сделать достаточно легко, нужно только захотеть.
Для архивного хранения — только PDF/A
Разумеется, PDFпо-прежнему хорош для архивного хранения, но в этом случае нужно использовать PDF/A, подмножество стандарта PDF, из которого исключены все возможности, которые привносят динамику и переменчивость, совершенно излишнюю для архива. Это касается javaScript, шифрования, встраивания аудио-видео контентаи ряда других «активных» функций.
Поэтому будьте внимательны: не всякий документ с расширением PDFможно принимать в архив!
Рендиции (Renditions) — это представления документа в формате, отличном от оригинального, но с полным соответствием по содержанию. Чаще всего для создания рендиций применяют формат PDF или HTML.
Это нужно для публикации документов из СЭД на корпоративном портале или официальном сайте организации. Следует признать, что PDFгораздо удобнее: его можно просматривать, скачивать и сохранять, что с HTMLдалеко не всегда получается и не все это умеют.
При этом вы можете не менять привычный процесс разработки и согласования документа, на сайт или портал пойдет только его финальная версия, которая может быть автоматически преобразована в PDF.
Выводы: PDFи СЭД
Итак, мы имеем чрезвычайно богатый возможностями формат, к тому же еще и открытый. Творчески его используя, можно дать пользователям гораздо более высокий уровень сервиса даже в простых повседневных операциях, таких как чтение. И можно придумать много новых сервисов.
Не торопитесь изобретать велосипед: PDFстал общественным достоянием более 5 лет назад. За это время появилось огромное количество разработок, в том числе СПО – поищите хорошенько, может быть писать ничего не придется.
Чтобы увидеть эти новые возможности, нужно прежде всего пересмотреть свои взгляды на СЭД: это не система учета документов, это система работы с документами – не с их атрибутами, с контентом.