В далеком 1981 году, на заре эры персональных компьютеров, основатель компании Microsoft Билл Гейтс заявил, что 640 Кб памяти с избытком хватит любому компьютеру. Сегодня, спустя три десятилетия, современному компьютеру едва хватает 2 Гб памяти (а это в 3,5 тыс. раз больше прогнозированного "максимума"), чтобы обработать минимальный поток данных.

Объемы данных растут в геометрической прогрессии. Согласно прогнозам IDC, количество данных к 2020 году достигнет 35,2 зеттабайта (один зеттабайт равен секстиллиону байт или триллиону гигабайт). По данным аналитиков компании Cisco, к 2016 году ежегодный объем глобального интернет-трафика составит 1,3 зеттабайт в год или 110 эксабайт в месяц. Это почти в четыре раза больше по сравнению с показателями за 2011 год (около 31 эксабайта в месяц). В час будут передаваться данные объемом до 150 петабайт. Для сравнения, Google в 2008 году обрабатывал всего лишь 20 петабайт данных в день.

Каждую минуту в мире создаются 98 000+ твиттов, 695 000 апдейтов статусов, 11 млн сообщений, отправляются 698 445 поисковых запросов в Google, 168 млн email-ов

Бизнес все больше и больше "обрастает" данными. Если раньше компании пользовались структурированными данными из внутренних источников, таких как, например, система внутреннего учёта (покупки, возвраты, каналы привлечения, адрес, склады, остатки, партнёры), то сегодня для того чтобы извлечь прибыль, необходимо собирать информацию из всех доступных и недоступных источников, учитывать внешние данные, которые на первый взгляд кажутся неуместными.

Большие данные (как объем данных) возникают в результате сбора неоднородных данных, поступающих из разных каналов информации: почты, сайта, CRM, SMM, телефонных звонков, прогноза погоды и т.д. Big Data (как технология) – это инструмент решения проблем. "Для меня Big Data – это даже не 3V, не 4V, это не анализ структурированных данных, это не скорость, потоки. Я отношусь к Big Data как к философии работы с данными", – поясняет Михаил Мушкин, руководитель бизнес-подразделения OSD Group - Direct Data.

По словам Владимира Люльки, управляющего партнера компании Intellica, компании должны научиться обрабатывать каждый байт информации, чтобы извлечь из Big Data самое важное для бизнеса – быть более эффективным, удовлетворять запросы клиентов, уменьшать риски и масштабировать бизнес.

Философия Big Data применима не только к огромнейшим массивам информации, но и к небольшим наборам данных. Использую подходы Big Data можно научиться извлекать нужные знания из 1 000, 10 000, 100 000, 1 000 000+ клиентов, их поведения, оценок. "Big Data – это не значит большие данные. Технология Big Data может быть применима и к относительно небольшим данным. Есть кейс, где философия подходов Big Data была реализована на семи тысячах строк. Это кейс про сумоистов, где аналитик пытался предугадать вероятность исхода поединка", – отмечает Михаил Мушкин.

Для того чтобы извлечь выгоду из информации, необходимо научиться её собирать, анализировать, выявлять тренды и, что самое главное, применять новые знания. На конференции BigData Conference эксперты и аналитики Big Data рассказали, как компании могут использовать данные в целях коммерции:

Следи за ними

Где живет ваш клиент? Где он работает? В каких ресторанах обедает? Каков его маршрут передвижения? Как часто он выезжает за границу? До эпохи Google Maps представителю e-commerce найти ответы на эти вопросы было почти нереально. Сегодня, благодаря геолокации на мобильных устройствах, компании могут, не нарушая общепринятых правил, отследить пользователя и выдать ему контент, соответствующий его географическому положению.

Геотаргетинг – это метод предоставления уникального контента и/или услуг с учетом точного географического местоположения пользователя. Геотаргетинг очень активно используется в интернет-маркетинге для размещения целевой рекламы. Параметры местоположения включают в себя такие факторы, как страны, провинции, города, почтовый индекс, IP-адрес и многое другое.

"Например, клиент часто подходит к банкомату, который является партнером его мобильного оператора. Соответственно, можно отследить, когда он подходит к банкомату этого банка и предложить произвести какое-то действие именно в этом банкомате, например, пополнить счет", – приводит пример Владимир Люлька.

Добыча знаний

Text mining, или технология глубинного анализа текста, позволяет при помощи алгоритмов выявить прежде неизвестные связи и знания в текстовых данных. Основное место добычи новых знаний – это большие объемы неструктурированной текстовой информации, которые невозможно обработать вручную.

"Нам говорят, что мы живем в век информации, но на самом деле это неправда. Мы живем в век знаний. Информация, на самом деле, это уже ничто. Просто знать, что у вас 57% лояльных клиентов, мало. Мы должны из информации получать знания. Знания мы получаем путем гипотезы, путем её проверки", – говорит Михаил Мушкин.

По сути, text mining – это инструмент, который позволяет "просеивать" большие объемы неструктурированной информации в поисках тенденций, шаблонов и взаимосвязей – самого важного для принятия правильных решений в самых разных сферах деятельности человека.

"С помощью text mining мы выявляем тренды и те зависимости, которые помогут использовать информацию для монетизации", – говорит Владимир Люлька.

В основе text mining лежат математические и лингвистические алгоритмы анализа текстовых данных. Типичный процесс добычи данных включает поиск информации, выявление смыслов, шаблонов, перекрестных ссылок, смысловой анализ текста, количественный анализ текста.

Персонализированная email-рассылка

Большие данные позволяют сегментировать клиентов и потенциальных потребителей по таким критериям, как товары, дата покупки, средний чек, пол, геолокация и история интернет-поиска, чтобы затем предоставить подходящий контент в нужное время и в нужном месте. При помощи технологии Big Data email-маркетинг становится более осознанным и персонализированным.

"Вы можете максимально четко попадать в интересы клиента, формируя суперперсонализированные предложения на основе сбора и анализа информации", – говорит Кристина Потоцкая, руководитель отдела маркетинга компании TriggMinе.

К примеру, из истории покупок можно собрать сведения о среднем чеке, количестве и частоте покупок – это все собирается в огромный массив данных для дальнейшей обработки. "Теперь я знаю, что если клиент купил у меня iPhone 6s, то через время можно предложить ему чехол. Если клиент покупает регулярно, например, каждые 2 месяца, то я понимаю, что через два месяца он с большой вероятностью придет что-то купить. То есть я могу ему что-то предложить", – поясняет эксперт.

Большие данные – не панацея от всех болезней. И не решение всех проблем. Это всего лишь инструмент, который можно и нужно использовать. Но только в руках умелого специалиста, который и ответственен за принятие важных решений, большие данные могут принести большую добавочную стоимость.

Автор: Алиса Иванова