Совсем недавно Артем Обухов выпустил блог «Большие
данные и их место в ECM» в котором обстоятельно
расписал что же такое Big Data применительно к ECM. Я предлагаю развить тему и посмотреть на нее с практической
плоскости.
На самом деле, примеров из жизни, где подходы Big Data уже актуальны,
больше, чем мы привыкли думать (просто терминология в России еще не прижилась, и
вопросы не анализируются в разрезе больших данных).
Например, в СМИ с Big Data связаны оценка интересов
пользователей, отслеживание социальной активности, количество перепостов
сообщений, автоматическая подготовка дайджестов и даже новостей.
В медицине большие данные накапливаются за счет
использования электронных медицинских карт, нательных датчиков, данных со
стационарных медицинских приборов. Так при анализе огромных объемов информации
становится возможным прогнозирование эпидемий.
В науке подходы Big Data актуальны в метрологии, геологии,
метеорологии, астрономии.
Спортивный менеджмент завязан на больших данных, к
примеру, за счет анализа больших объемов информации осуществляется прогноз продажи
билетов, а также расчет букмекерских коэффициентов.
И это уже реальная повседневная жизнь!
А что происходит на уровне корпоративных систем, и, в
частности, ECM-системах.
Big Data и ECM
Я буду оперировать фактами и данными, собранными на основе
анализа работы нашей компании (DIRECTUM) в ECM-системе за 10 лет.
Вот некоторые факты:
Число
пользователей системы
Число накопленных
в системе документов, процессов, записей справочников
Вы можете наблюдать, что динамика прироста данных выше,
чем динамика прироста пользователей системы. Чем это было вызвано?
Сотрудники компании стали активнее использовать ECM-систему, стало инициироваться больше бизнес-процессов, как
связанных с классическим делопроизводством (входящие, исходящие,
организационно-распорядительные документы), так и лежащих за его пределами:
работа с договорами, счетами, финансовым архивом, межкорпоративное взаимодействие
и так далее. Как раз неклассические задачи и придали большой рывок.
Удельный объем данных на одного сотрудника все возрастает,
как и их разнообразие. При таком тренде должен наступить момент, когда люди
перестанут справляться с информацией, «потонут» в ней. Но это ли уже «больше
данные» или они виднеются только на горизонте?
Чтобы разобраться, предлагаю разделить все бизнес-задачи
на классические (работа с ОРД, входящими и исходящими документами, несложными
бизнес-процессами), привычные для бизнеса и сотрудников, с четко
зафиксированными регламентами; и неклассические (обработка счетов на оплату и
ведение финансового архив, обработка обращений населения, кредитные заявки и
пр.), зачастую связанные с взрывным ростом объема данных.
Классические задачи документооборота и объемы данных
День
Месяц
Год
Пользователи
1000
1200
3000
Регистрационно-контрольные
карточки (РКК)
5400
130 000
3 888 000
Документы
5500
132 000
3 960 000
Процессы
8400
202 000
6 048 000
Вот пример одной крупной компании, нашего клиента, с
одновременной работой в ECM-системе 1000 пользователей
и динамикой роста подключений до 3000 до конца года. Даже в рамках решения
классических задач за год в системе инициируются миллионы бизнес-процессов, появляются
миллионы документов и РКК. Это гигабайты информации, рост которых будет только
расти. Миллионы – это уже не десятки тысяч!
На таких объемах даже в классических задачах
документооборота можно говорить о начале работы с большими данными. Это и
большой объем с необходимостью обеспечения высокой масштабируемости. И высокая
скорость прироста данных при их разнообразии, которые порождают
бизнес-потребность в получении статистики и анализу работы в режиме реального
времени, а крупные компании не терпят простоя.
Что же происходит при решении неклассических задач?
Неклассические задачи ЭДО и взрывной рост информации
Для примера рассмотрим различные отраслевые задачи
госсектора, банков и ритейла.
Работа госучреждений с обращениями граждан
Автоматизация межведомственного электронного взаимодействия
В рамках реализации пилотного проекта в одном субъекте РФ
по переводу государственных и муниципальных услуг в электронный вид нами было
замерено, что из регионального органа в федеральный центр поступает объем
запросов равный 270 000 обращений в год. Одновременно внутри региона генерируется
70 000 обращений.
И это только пилотный проект на первом десятке госуслуг, с
подключением новых услуг объем вырастет на порядки до миллионов обращений. А
если взять во внимание все субъекты РФ, то объем увеличится еще на два порядка
до сотен миллионов обращений в год.
Работа многофункциональных центров
В потенциале МФЦ должен обрабатывать до 50 000
документов в день или 12 миллионов в год. Объем документов составит более 100 гигабайт
в день или 25 терабайт в год. Это колоссальное количество передаваемой
информации. Все эти данные надо хранить и обрабатывать при новых запросах
граждан.
Потребительские кредиты и банк
Ежедневно в банк средней руки может поступать до
10 000 обращений с заявками на потребительские кредиты. Только приемом
таких заявок в едином центре будут заниматься 200 сотрудников. А после приемки
заявки необходимо обработать, провести через кредитный комитет и вынести по ним
решения о выдаче кредита. Оптимально, если одна заявка будет обрабатываться не в
течение нескольких дней, а за час. Так работает кредитный конвейер.
И если для автоматизации принятия решения существуют
специальные информационные системы, то в области ввода и первоначальной
обработки информации ИТ-решения только-только начинают использоваться (вспомните,
как часто сканируют ваш паспорт при обращении в банк, даже в один и тот же,
даже в одно отделение, к одному операционисту?).
Обмен финансовыми документами в ритейле
Ежемесячно через крупные торговые сети проходит до
100 000 бумажных счетов. Все счета, как правило, обрабатываются в
корпоративном центре.
Одной из важных задач ритейлеры ставят переход на
электронное взаимодействие с контрагентами, потому что уже сейчас текущие
объемы данных ставят в тупик бухгалтерию при необходимости быстро сформировать
подборку документов для встречной или камеральной проверки. Серьезной проблемой
становится также поиск площадей для хранения документов.
А с переходом на электронное взаимодействие при интеграции
с EDI количество документов вырастет
еще больше за счет появления сопроводительной электронной договорной
документации.
Большие данные и поиск новой эффективности
Из приведенных примеров видно, что большие массивы данных
в ECM-системах накапливаются и обрабатываются уже
сейчас (или накопятся в самое ближайшее время) – это документы, бизнес-процессы,
записи справочников, история, права доступа и т.д.
Помимо их хранения, ими необходимо управлять, проводить
анализ и искать новые пути повышения производительности работы. Если с
отчетностью все более или менее понятно (плюсы BI хорошо изучены), то поиск гипотез о поведении пользователей,
вопросы повышения эффективности бизнес-процессов ставят перед ECM-системами
и их потребителями новые интересные задачи.
Рассмотрим эти гипотезы
Анализ данных и вовлечение сотрудников
Правильная работа документами
Можно оценивать частоту работы с документами для принятия
решений об их автоматическом переносе в архив, смене прав доступа. Или даже для
формирования подборок документов, подходящих для определенного круга
сотрудников для текущей работы.
Число обращений
к документу, описывающему технологии и процессы
Пример с документом, описывающим процедуру работы в
компании. Мы видим, что в период появления документа большое количество
сотрудников массово его просматривали. С течением времени поток обращений
снизился и зафиксировался на уровне только новичков (т.к. базовым технологиям
текущие сотрудники уже привыкли следовать). На основе такой статистики система
сама может сделать вывод о необходимости переноса документа в архивное
хранилище, а также включение его в список обязательных документов для всех
новичков.
Профиль загрузки сотрудников
Система сама может оценить профиль загрузки сотрудника, в
том числе статистику работы с документами и выполнения заданий, может посылать
сигналы о необходимости гармонизации загрузки, перераспределения процессов на
коллег.
Статистика о
работах и загрузке сотрудника в ECM-системе
Например, из данных графика система может понять, что в
2009 году сотрудник перешел на руководящую должность, отметив, что его профиль
работы сменился, что он стал выполнять больше «быстрых» заданий, вероятно, и больше
делегировать. Но при этом процент просроченных остался неизменным, но с учетом
роста количества задач, количество просроченных стало угрожающим. Вероятно,
отследив это средствами системы, стоит просигнализировать сотруднику о факте неприемлемого
роста количества просроченных заданий.
«Цифровой след» сотрудника
Еще одна интересная гипотеза – это отслеживание «цифрового
следа» сотрудника, оставленного при работе с различными массивами данных,
взаимодействии с коллегами, прочей рабочей активности. На его основе могут
выявляться поведенческие гипотезы, которые позволят повысить удобство
взаимодействия пользователя с системой, окружением (другими системами, коллегами).
Игровые механики
Внедрение в корпоративное окружение элементов игры может
стать инструментом анализа поведения пользователей, стимулирования правильного
использования функций системы и глубокого их изучения, следования технологиям компании
и повышения эффективности.
Элементы геймификации, внедренные в нашей компании,
подтвердили предположения о том, что новый подход становится стимулом для
сотрудников. Мы также выявили неожиданный факт, что основными участниками стали
не молодые сотрудники, а опытные, в возрасте за 30 лет, а также топ-менеджмент,
который нашел в игре новый элемент поиска активных сотрудников и оценки их эффективности.
Другим механизмом вовлечения может стать пересмотр
принципов работы сотрудников в корпоративных системах – от контента к
взаимодействую внутри рабочих групп. Формирование кругов по интересам (отделы,
крупные проекты, рабочие группы, профессиональные клубы и гильдии), получение
информации от коллег, формирование профессиональных дайджестов, внутренних
чатов – все это инструменты, которые могут помочь в вовлечении сотрудников и
повышении эффективности их работы.
Поиски закономерностей внутри работы плотно
взаимодействующих групп, быстрая передача им полномочий и информации,
закрепление результата, неформальная субординация, принципы хранения и
использования данных – все это становится возможным при включении социальных
механизмов в корпоративную среду.
И, если речь идет о крупной компании, имеющей в штате
тысячи сотрудников, накопление корпоративной статистики и ее анализ должны как
можно быстрее переходить от гипотез к реальным шагам.
В качестве вывода
Оценивайте объемы, разнообразие, скорость прироста и
оперативность анализа своих данных. Если вы ожидаете взрывного роста или приближения
к рубежу Big Data
– для вас это серьезное основание поговорить с поставщиком вашей ECM-системы о поддержке механизмом обработки больших данных.
А также с вашим руководством о возможности повышения эффективности бизнеса за
счет раскрытия новых, неожиданных закономерностей в работе сотрудников с
корпоративной информацией.
***
Материал подготовлен на основе выступления автора на DOCFLOW 2014, а также его статьи, опубликованной на портале CNews.