Тем, что современные гаджеты собирают информацию о своих хозяевах, уже давно никого не удивить. Неудивительно и то, что к слежке за пользователями присоединились «голосовые помощники» – программы, построенные на распознавании человеческой речи. И если продукты западных ИТ-гигантов обычно используют полученные данные для рекламы товаров и услуг, то сверхуспешная разработка китайской корпорации iFlytek научилась отправлять подслушанное прямо правительству КНР. Громче всех об этом факте заявляет именно американская сторона, чьи разработчики владеют приемами шпионажа ничуть не хуже китайских коллег.

«Ты помнишь, как все начиналось»

Исследование пути Китая к освоению одной из самых перспективных ИТ-технологий было опубликовано изданием Wired, назвавшим основоположником распознавания китайской речи Джулиана Чена – сотрудника американского цифрового гиганта IBM, полиглота, доктора Колумбийского университета и мученика китайской Культурной революции.

Дело в том, что одна из первых программ, позволявших диктовать сообщения, не касаясь клавиатуры, была разработана именно IBM, а 1994 году компания начала искать кого-нибудь, кто бы «научил» ее продукт китайскому языку. Реализацию амбициозной задачи доверили Чену, который сразу же понял, что это новшество полностью изменит общение в его родной стране: в компьютерную эпоху китайская письменность долгое время являлась уникальной проблемой, поскольку очевидного способа ввода более 50 000 иероглифов на клавиатуре QWERTY попросту не существовало.

Чтобы создать свой механизм диктовки, Чен разбил наиболее распространенный пекинский диалект китайского на мельчайшие элементы, называемые фонемами. Затем он нанял 54 носителей языка и записал, как они читают статьи из «Жэньми́нь жиба́о», главного издания Поднебесной. Внесла свою лепту и исследовательская лаборатория IBM в Пекине. Через два года айтишник триумфально презентовал свою разработку в Китае. В демонстрации программы участвовал даже тогдашний руководитель китайской компартии Цзян Цзэминь, и вскоре производители персональных компьютеров по всему Китаю, включая конкурентов IBM, стали предустанавливать этот прообраз голосовых помощников на свои устройства.

Достойные последователи и их путь

Среди тех, кого вдохновил триумф IBM и Джулиана Чена, был Лю Цинфэн, 26-летний аспирант лаборатории распознавания речи в престижном Университете науки и технологий в Хэфэе. А в 1999 году им была основана компания iFlytek. Несмотря на скепсис американских конкурентов, Цинфэн не побоялся бросить им вызов под лозунгом «Голос – это основа культуры и символ нации».

Свою главную разработку, приложение iFlytek Input, будущий китайский ИТ-гигант запустил в 2010 году. В это же время у Apple появилась Siri – говорящий цифровой консьерж, который мог отвечать на вопросы владельца iPhone. Функционал же китайского помощника сразу был ориентирован на расшифровку человеческого голоса.

Вышло так, что Siri и Input стали первыми ласточками технологий голосового интерфейса. Позже к ним присоединились Cortana от Microsoft, Alexa от Amazon и Google Assistant. При этом китайское приложение сразу имело важную отличительную черту – соглашение о конфиденциальности данных, позволяющее ему собирать и использовать личную информацию пользователей в целях «национальной безопасности» без их согласия. Этот нюанс в деятельности iFlytek, которой принадлежит 70 процентов китайского рынка голосовой связи с 700 миллионами конечных пользователей, в последствие живо заинтересовал западную прессу.

Как сообщал Wired, потребительские услуги важны для iFlytek, но около 60 процентов прибыли компании формируется тем, что в отчете компании за 2019 год описывается как «проекты с государственными субсидиями». К таким проектам относятся «интеллектуальная система помощи при расследовании уголовных преступлений», а также поддержка технологий обработки больших данных для правительства Шанхая. В подтверждение этого факта ученые из Института будущего человечества Оксфордского университета, изучающий управление ИИ в Китае, немедленно обнаружили связи Лю Цинфэн с китайскими властями.

Взаимоотношениям китайского ИТ-гиганта с китайским же правительством посвящена внушительная часть исследования, опубликованного американским изданием. Но так ли все гладко у глобальных цифровых компаний из самих Соединенных Штатов?

В эпицентре скандалов

Как бы ни пытались американские корпорации навести тень на конкурентов из Китая, угрожающих их гегемонии на мировом рынке высоких технологий, разработанные ими голосовые помощники оказываются в центре шпионских скандалов порядком чаще. Так, недавно выяснилось, что Apple практикует скрытное включение уже упомянутой Siri, чтобы записывать переговоры пользователей, даже когда программа у них не активирована. И это нарушение приватности практикуется «яблочной» компанией систематически.

Еще раньше в Глобальной Сети появилась информация о том, что Windows 10 поставлялся с предустановленными настройками, предоставляющими Microsoft возможность отслеживать вводимую пользователями текстовую и голосовую информацию, не говоря уже о сведениях о местоположении, контактах, записях в календаре и истории браузера. Эти данные, вероятно, использовалась ИТ-гигантом для показа таргетированной рекламы, однако источник также не исключил, что Microsoft «заглядывает» в файлы пользователей по требованию правящего режима США, хотя «политика конфиденциальности» разработчика явно этого не предполагает.

В свою очередь, подрядчик Google VRT NWS в июле 2019 года «слил» одному из бельгийских изданий тысячу записей голосовых помощников. По ним журналисты смогли идентифицировать несколько человек. Одновременно с этим подрядчик Apple признался британскому The Guardian, что на имеющихся в его распоряжении записях, часто можно услышать, как люди занимаются сексом, покупают наркотики или описывают свое самочувствие. В том числе это происходит, когда люди случайно зажимают кнопку вызова голосового ассистента.

В августе 2019 Apple и Google объявили, что их подрядчики перестанут прослушивать разговоры пользователей с голосовыми ассистентами Siri и Google Assistant, и что их сотрудники слушают записи разговоров пользователей с устройствами только чтобы улучшать качество их работы. Так это или нет, по-прежнему остается неизвестным.

Чудо или худо

Голосовые помощники, как и другие цифровые сервисы, давно стали рутинной частью повседневной жизни. Но для того, чтобы взаимодействовать с нами максимально эффективно, приложениям необходимо узнавать нас. И в принципе, в сборе информации о пользователях для обучения алгоритмов нет ничего предосудительного и опасного, если он проводится в полном соответствии с законом, с согласия пользователя, а также если данным обеспечена надлежащая безопасность. Как показывает опыт китайских и американских сервисов, обеспечение приватности не входит в число их приоритетов. Но даже зная это, люди не перестанут пользоваться комфортными и привычными гаджетами. Перестать пользоваться мобильными приложениями сегодня – как добровольно отказаться от столовых приборов и есть руками: неудобно, не актуально, не модно.

Так сложилось, что техногиганты первыми осознали, что данные – это новая нефть. И чтобы сохранить и преумножить лидирующие позиции на глобальном рынке цифровых технологий, они будут стремиться получать информацию о пользователях любой ценой. А нелегальный шпионаж (в любых, даже якобы гуманных целях) – как ни цинично, всего лишь один из их инструментов. Не более того.

Главный вопрос – если компании готовы пойти на всё, ради данных, то кто защитит пользователя от тотального произвола? К кому идти за помощью? Как ни парадоксально – только к государству. Как показывает мировой опыт, именно государственные структуры – единственные, кто могут заставить техногигантов соблюдать правила игры и права человека. Но власти должны иметь для этого правовые основания.

В России право гражданина на безопасность личной информации с этого лета гарантируется основным законом. Возможно, этот факт ещё долго будет для нас непривычным, а для кого-то – неприятным. Ровно до тех пор, пока не выяснится, что ваша Siri старательно записывает все ваши похождения. С неясными целями.