У человеческого мозга есть две особенности. Во-первых, если он что-то запомнил, он не может это забыть. Во-вторых, он всё-таки может это забыть. И если первая уже практически в совершенстве реализована во всех проявлениях вычислительной техники, то вторая — способность забывать — ещё только на подходе.
Сегодня трудно представить организацию, которая не накапливала бы данные, приходящие извне (от официальных документов до форм на сайте компании) и генерируемые внутри (записи телефонных звонков, «следы» бизнес-процессов). Рынок хранения этих данных оценивается миллиардами долларов, а информация оценивается как один из основных активов и имеет свою ценность (и даже цену). Всяческие устройства с приставкой «смарт-» проникают в жизни людей, а оттуда — и в организации: в порядке вещей подключить корпоративную почту на своём смартфоне, а открытость активности каждого пользователя сети позволяет HR-службам собирать пресловутые большие данные о сотрудниках предприятия.
Планомерное падение цен на хранение данных не компенсирует расходы на хранение данных — прирост последних быстрее в разы.
Нет никакой надежды на то, что рост генерируемых данных замедлится. Учитывая тенденцию расценивать любую активность человека или машины как данные, не рассматривая при этом вопрос их значимости, мы движемся прямиком к точке, когда никакой бюджет попросту не справится.
Из ситуации есть два очевидных выхода: собирать меньше данных (отбирать важное) и забывать уже накопленное. Первый метод уже обсуждался, подход к нему очень прямолинейный: определиться, какие данные важны, а остальные отсеивать, — и точка.
Второй метод тоже обсуждается, но «в соседней комнате»: как превращать данные в знания, отсекая пост-фактум лишнее и оптимизируя их объём; как хранить знания в сильно связанной сети; как стереотипизировать данные, выделять шаблоны, структурировать и устранять повторы, и т.д.
Этой заметкой предлагаю поднять тему «забывания» данных, чтобы понять, насколько это важно и вообще возможно реализовать применительно к корпоративным данным, принимая как факт то, что тренд не ослабится — динамика сбора данных о любых действиях и операциях будет идти только вверх.