Популярные группы

← Предыдущая статья Следующая статья →

Понимает эмоции и умеет шутить

Компания OpenAI представила новую версию своего искусственного интеллекта — GPT-4 Omnia (GPT-4o). Это революционное обновление, которое наверняка разделит историю OpenAI на «до» и «после». Если раньше пользователи могли общаться с сервисом компании только в формате чат-бота, то теперь нейросеть может слышать и видеть людей, а также понимать эмоции и имитировать их сама. Благодаря GPT-4o ИИ OpenAI буквально ожил. «Газета.Ru» рассказывает, почему это одновременно и завораживает, и пугает.

Почему так много хайпа?

GPT-4o представили вечером 13 мая, и новинка мгновенно произвела фурор — пятиминутное видео, в котором соучредитель OpenAI Грег Бауман общается с нейросетью за ночь набрало полмиллиона просмотров. На YouTube-канале компании еще ни один клип не набирал популярность так быстро.

Чем же GPT-4o всех так впечатлила? Ну, как минимум тем, что она по сути стала тем самым компьютерным помощником из фильмов и видеоигр, которые видят человека, комментируют происходящее, отпускают шутки и не только. Джарвис из «Железного человека», Кортана из Halo и, наконец, Саманта из фильма «Она», в котором герой Хоакина Феникса влюбляется в ИИ. Об этом в своем блоге заявил и сам основатель OpenAI Сэм Альтман.

«GPT-4o похож на ИИ из фильмов; и меня до сих пор немного удивляет, что это реально», — написал он. К слову, с Самантой у GPT-4o общего больше, чем просто ассоциация. Во-первых, в демонстрационных видео GPT-4o говорит голосом, очень похожим на голос Скарлетт Йоханссон, которая и озвучивала ИИ в «Она». Во-вторых, Альтман не раз говорил, что он большой поклонник этого фильма, а после презентации GPT-4o опубликовал в X (бывшая Twitter) короткое сообщение: «она».

Что умеет GPT-4o?

В первую очередь стоит отметить улучшение работы ИИ с голосом. Она стала значительно быстрее, что позволяет общаться с сервисом в режиме реального времени — не нужно записывать голосовые сообщения, отправлять их на сервер и ждать ответ в виде другой аудиозаписи. Все происходит максимально нативно, по ощущениям, GPT-4o сейчас — лучший голосовой интерфейс для компьютера.

Синтез речи тоже оказался выше всех похвал. Судя по представленным компанией образцам, GPT-4o в этом плане на порядок лучше Alexa от Amazon, Google Assistant, Алисы от «Яндекс» и тем более Siri от Apple. Речь GPT-4o звучит естественно: в ней нет присущих робоголосам перепадов интонаций.

Более того, новая нейросеть синтезирует правдоподобные междометия и даже смех. От последнего, правда, бегут мурашки по коже: не потому что он плохой, а наоборот — слишком правдоподобный. Вторым большим достижением OpenAI стало включение зрения для нейросети. Запуская ИИ на смартфоне или компьютере, GPT-4o подключается к встроенной камере устройства и анализирует объекты в кадре. Например, программа улавливает изменения в мимике человека и тем самым определяет эмоции собеседника не только по тембру голоса, но и по его лицу. Жесты, животные, одежда, мебель и многое другое тоже подвержены анализу, идентификации и интерпретации со стороны GPT-4o.

Дополняет имитацию личности понимание сарказма и юмора. GPT-4o не только распознает шутки человека и игриво над ними хихикает, но и сама активно подтрунивает над собеседниками. Ничего, кроме шока, это во время просмотра демонстрационных клипов от OpenAI не вызывает.

«На презентации действительно показали модель, которая избавилась от типичной задержки в ответе, что показывает уровень связки работы нескольких модулей ИИ. Это нельзя назвать нововведением, но в связке с видеоаналитикой создается заслуженный вау-эффект», — поделился мнением маркетинг-лид компании-разработчика ИИ-решений Neuro.net Андрей Дорогавцев.

Какая польза GPT-4o?

Сценариев применения GPT-4o масса. Только OpenAI во время презентации показала несколько десятков. Разработчики предлагают использовать новую нейросеть для развлечений, в качестве собеседника, переводчика, образовательной платформы и не только. Например, в одном из демо-роликов GPT-4o играет с людьми в «Камень, ножницы, бумага», в другом — выступает в роли переводчика для двух людей, один из которых знает только испанский язык, а второй — только английский, в третьем — нейросеть становится глазами для незрячего: человек водит объективом камеры, а ИИ подробно описывает объекты в кадре.

К слову, в нейросеть в режиме реального времени можно загружать не только видео с камеры, но и изображение с рабочего стола компьютера. В этом случае GPT-4o быстро проанализирует содержимое и сможет его прокомментировать. Например, программисту сервис может подсказать, как оптимизировать код, художнику — как улучшить изображение, фотографу — как отретушировать снимок, и так далее.

Если говорить об экономической перспективе GPT-4o, то здесь можно провести некоторые связи с корпорацией Apple. Вообще, OpenAI никак не монетизирует ChatGPT , если не считать платный тариф за $20 в месяц, который нужен разве что корпоративным пользователям или большим энтузиастам. Однако скоро у OpenAI и ChatGPT появится большой клиент в лице корпорации Apple.

Apple интегрирует ChatGPT и другие ИИ-инструменты GPT в iOS, iPadOS и macOS. Отдельно инсайдеры подчеркивают, что одна из версий GPT станет базой голосового ассистента Siri, над которым уже давно посмеиваются из-за его никчемности. В свете этих событий становится очевидным, что GPT-4o — это готовый сетап для той же Siri.

Если Apple сможет реализовать на iPhone хотя бы половину из представленных функций GPT-4o, она мгновенно вырвется в авангард интеллектуальной потребительской техники. Подробнее об интеграции ChatGPT в свои операционные системы Apple расскажет в июне 2024 года в рамках конференции разработчиков WWDC. Примечательно, что полноценный релиз GPT-4o также запланирован на июнь.

Это опасно?

В конце 2023 года совет директоров уволил с поста генерального директора OpenAI сооснователя компании Сэма Альтмана. Вскоре после разразившегося скандала Альтмана восстановили в должности, но спонтанное решение руководства компании до сих пор окутано тайной.

При этом наверняка известно, что одной из причин увольнения сооснователя OpenAI стала жалоба от нескольких сотрудников исследовательского отдела. В своем письме они заявили, что компания приблизилась к «мощному открытию в сфере ИИ, которое может угрожать человечеству». Подробности об открытии не упоминались, но сообщалось, что Альтман намерен коммерциализировать новую технологию, не осознавая последствий от ее использования.

Неизвестно, является ли GPT-4o тем самым загадочным проектом OpenAI, но легко можно предположить, что да. Ведь кажется, что, даже если люди не начнут массово влюбляться в свои смартфоны, то мошенники точно будут использовать новые голосовые возможности нейросети в преступных целях.

Руководитель группы исследований и разработки технологий машинного обучения в «Лаборатории Касперского» Владислав Тушканов считает, что сама GPT-4o не представляет большой опасности для людей в плане кибербезопасности, однако этого нельзя сказать об использовании злоумышленниками других аналогичных технологий. «Новый функционал демонстрирует то, что является потенциально возможным с точки зрения технологий — генерацию реалистичного голоса с правильными интонациями и эмоциями, причем практически в режиме реального времени. Учитывая, что развитие открытых инструментов в сфере генеративных нейросетей идет достаточно быстро, можно ожидать в будущем других аналогичных открытых решений, которые уже могут быть теоретически использованы злоумышленниками», — сказал Тушканов.

По мнению специалиста, представленные OpenAI обновления кажутся хоть и масштабными, но эволюционными, а не революционными. Тушканов считает, что с точки зрения кибербезопасности принципиально новых векторов угроз GPT-4o не добавляет.

Версия для печати

Из выпуска рассылки Газета.Ru - Первая полоса

Автор:

Газета.Ru

Комментарии

Subscribe. Авто и компьютеры Подписаться | В избранное

Комментарии временно отключены

Ранее в разделе

Самое популярное в разделе

{#template MAIN} <div id="loginForm" style="display:none;" class="subscriberu_popup"> <div class="popup_register"> {#include js_tmpl_auth_reg_tab} {#if $P.login_register_tab == 1} <form class="authentication-form" method="post" action="/MEMBERLOGIN_authen_cred"> <dl class="rg_block_options"> <dt id="js_tap_panel_auth"> <h1>Войти на сайт</h1> {* {#include js_tmpl_auth_reg_button} *} {#include js_tmpl_auth_reg_action} <hr class="logreg_line noPhones"> <div class="logreg_descr noPhones"><p>{#include js_tmpl_auth_reg_descr} </p></div> <div class="logreg_advice noPhones"> Если вы еще не с нами, то начните с <a href="#" onclick="rgNav('js_tab_reg');return false;" class="dashed" data-func="registr">регистрации</a> </div> <br><br> <a class="dashed auth-enter" href="/manage/author/"><b>Вход для авторов</b></a> </dt> </dl> </form> {#/if} {#if $P.login_register_tab == 2} <div class="rg_block_options"> <div id="js_tap_panel_auth"> <h1>Регистрация</h1> <div class="social_reg"> {* <div class="rg_description">{#include js_tmpl_soc_auth_reg_descr}</div> *} {#include js_tmpl_auth_reg_soc} <div class="rg_soc_auth_agree">{#include js_tmpl_auth_reg_agree}</div> </div> <div class="subscribe_reg"> {* <div class="rg_description"> #include js_tmpl_auth_reg_descr </div> *} {#include js_tmpl_auth_reg_action} </div> {* {#include js_tmpl_auth_reg_button} *} <div class="clr"> </div> <hr class="logreg_line noPhones"> <div class="logreg_descr noPhones">{#include js_tmpl_auth_reg_descr} {#include js_tmpl_soc_auth_reg_descr} </div> </div> </div> {#/if} </div> {* <div class="gray_bg register_shadow"></div> *} </div> {#/template MAIN} {#template js_tmpl_auth_reg_tab} <ul class="rg_nav"> <li id="js_tab_auth" class="{#if $P.login_register_tab == 1} rg_active_nav {#/if} rg_first_nav"><a onclick="rgNav('js_tab_auth');return false;" href="">Вход на сайт</a></li> <li id="js_tab_reg" class="{#if $P.login_register_tab == 2} rg_active_nav {#/if}"><a onclick="rgNav('js_tab_reg');return false;" href="">Регистрация </a></li> </ul> <span onclick="hidebo();" class="rg_closed"> </span> {#/template js_tmpl_auth_reg_tab} {#template js_tmpl_auth_reg_action} {#if $P.login_register_tab == 1} {#include js_tmpl_auth_reg_soc} {#/if} <div class="rg_forms"> <input type="hidden" id="login_register_destination" value="{$P.login_register_destination}"/> {#if $P.login_register_tab == 1} <div class="rg_for_input"> <span class="rg_text_inner">E-mail или код подписчика</span> <input id="credential_0" class="js_keydown_selector rg_input_text" data-js_submit="no" data-js_next_input_name="credential_1" name="" type="text" /> </div> <div class="rg_for_input"> <span class="rg_text_inner">Пароль</span> <input id="credential_1" class="js_keydown_selector rg_input_text" data-js_submit="yes" data-js_action="js_loginFormBut" name="" type="password" onkeyup="showAttention(this,!!window.event.shiftKey)" /> <span class="pswd_attention" id="attention_pswd"> <span class="icon_attention"></span> <span class="pswd_attention-text" id="attention-text_pswd1">Русская раскладка клавиатуры!</span> <span class="pswd_attention-text" id="attention-text_pswd2">У вас включен Caps Lock!</span> <span class="pswd_attention-text" id="attention-text_pswd3">У вас включен Caps Lock и русская раскладка клавиатуры!</span> </span> </div> <div class="rg_for_input input-alien"> <span class="chk noPhones"><input id="chk_alien" name="" type="checkbox" /></span><label for="chk_alien" class="noPhones"> Чужой компьютер</label> <a class="forgot_pass" href="/member/totalrecall">Забыли пароль?</a> </div> <div class="rg_for_input"> <em id="auth_msg" class="reg_error"></em> <input id="lf_typeauthid" value="email" type="hidden"> <input type="submit" class="button button-red logreg_submit" id="js_loginFormBut" value="Войти">  <div class="loading loading-cover" style="display: none;"><div class="loader"></div></div> </div> {#/if} {#if $P.login_register_tab == 2} <div class="rg_for_input"> <span class="rg_text_inner">E-mail</span> <input id="arfemail" class="js_keydown_selector rg_input_text" name="" type="text" data-js_submit="yes" data-js_action="js_regFormBut"/> </div> <div class="rg_for_input rg_set_lineh rg_for_input_wide"> <label class="js_tap_panel_checkbox"> <span class="chk"><input name="" id='js_tap_panel_checkbox_terms' type="checkbox" data-js_submit="yes" /></span> Я ознакомился и согласен с <a class="link_txd logreg_accLink" href="/faq/vereinbarung.html">условиями сервиса Subscribe.ru</a> </label> <br /> <label class="js_tap_panel_checkbox"> <span class="chk"><input name="" id='js_tap_panel_checkbox_personal' type="checkbox" data-js_submit="yes" /></span> Нажимая на кнопку "Готово!", я даю <a class="link_txd logreg_accLink" href="/faq/persverordnung.html">согласие на обработку персональных данных</a> </label> </div> {* <div style="float: left;position: absolute;left: 11em;"> <img src="http://www.kupivip.ru/images/vip/logo.png?1604" style="width: 86px; vertical-align: middle;display: block;"> </div> <div class="rg_for_input rg_set_lineh"> <label class="js_tap_panel_checkbox"><input name="" id="js_tap_panel_checkbox_kupivip" type="checkbox" data-js_submit="yes"> Я хочу получать новости о скидках на одежду</label> </div> *} <div class="rg_for_input"> <em id="reg_msg" class="reg_error rg_for_input_wide"></em> <em id="reg_msg2" class="reg_error rg_for_input_wide"></em> <input id="rf_typeauthid" value="email" type="hidden"> <a class="button button-red logreg_submit" id="js_regFormBut" href="#">Готово!</a> <div class="loading loading-cover" style="display: none;"><div class="loader"></div></div> </div> {#/if} </div> {#/template js_tmpl_auth_reg_action} {#template js_tmpl_auth_reg_agree} <div class="rg_for_input rg_set_lineh rg_for_input_wide"> <label class="js_tap_panel_checkbox"> <span class="chk"><input name="" id='js_tap_panel_checkbox_terms_reg' type="checkbox" data-js_submit="yes" /></span> Я ознакомился и согласен с <a class="link_txd logreg_accLink" href="/faq/vereinbarung.html">условиями сервиса Subscribe.ru</a></label> <em id="reg_msg_soc" class="reg_error rg_for_input_wide"></em> </div> {#/template js_tmpl_auth_reg_agree} {#template js_tmpl_auth_reg_button} <div class="rg_butons_socials"> {#if $P.login_register_tab == 1} <a class="rg_btn_soc rg_bs_01 js_tap_panel_selector" action="auth_email" href="#"><span><i></i>Email</span></a> <a class="rg_btn_soc rg_bs_01 js_tap_panel_selector" action="auth_openid" href="#"><span><i></i>OpenID</span></a> <a class="rg_btn_soc rg_bs_02 js_tap_panel_selector" action="auth_vkontakte" href="#"><span><i></i>Вконтакте</span></a> <a class="rg_btn_soc rg_bs_02 js_tap_panel_selector" action="auth_mailru" href="#"><span><i></i>Mail.Ru</span></a> {#/if} {#if $P.login_register_tab == 2} <a class="rg_btn_soc rg_bs_01 js_tap_panel_selector" action="reg_email" href="#"><span><i></i>Email</span></a> <a class="rg_btn_soc rg_bs_01 js_tap_panel_selector" action="reg_openid" href="#"><span><i></i>OpenID</span></a> <a class="rg_btn_soc rg_bs_02 js_tap_panel_selector" action="reg_vkontakte" href="#"><span><i></i>Вконтакте</span></a> <a class="rg_btn_soc rg_bs_02 js_tap_panel_selector" action="reg_mailru" href="#"><span><i></i>Mail.Ru</span></a> {#/if} </div> {#/template js_tmpl_auth_reg_button} {#template js_tmpl_auth_reg_descr} {#if $P.login_register_tab == 1} Для оформления подписки на выбранную рассылку, работы с интересующей вас группой или доступа в нужный вам раздел, просим авторизоваться на Subscribe.ru {#/if} {#if $P.login_register_tab == 2} Для регистрации укажите ваш e-mail адрес. Адрес должен быть действующим, на него сразу после регистрации будет отправлено письмо с инструкциями и кодом подтверждения. {#/if} {#/template js_tmpl_auth_reg_descr} {#template js_tmpl_soc_auth_reg_descr} Или зарегистрируйтесь через социальную сеть. {#/template js_tmpl_soc_auth_reg_descr} {#template js_tmpl_auth_reg_soc} <div class="rg_soc"> {#if $P.login_register_tab == 1} <a onclick="return _checkSocConfirm(event)" href="https://oauth.vk.com/authorize?client_id=3954260&scope=wall,offline,photos,groups,video,audio,email&redirect_uri={location.protocol+'//'+location.host}/member/login/vk/&response_type=code&v=5.15" class="login_register_vk_button"> <span class="login_register_vk_icon"></span> </a> {#/if} {#if $P.login_register_tab == 2} <a onclick="return _checkSocConfirm(event)" href="https://oauth.vk.com/authorize?client_id=3954260&scope=wall,offline,photos,groups,video,audio,email&redirect_uri={location.protocol+'//'+location.host}/member/join/vk&response_type=code&v=5.15" class="login_register_vk_button"> <span class="login_register_vk_icon"></span> </a> {#/if} </div> {#/template js_tmpl_auth_reg_soc}

{#template MAIN} <div id="loginForm" style="display:none;" class="subscriberu_popup"> <div class="popup_register"> {#include js_tmpl_auth_reg_tab} <dl class="rg_block_options"> <dt id="js_tap_panel_auth"> <p class="rg_description">{#include js_tmpl_auth_reg_descr}</p> <div class="clr"> </div> {#include js_tmpl_auth_reg_action} <div class="clr"> </div> </dt> </dl> </div>  </div> {#/template MAIN} {#template js_tmpl_auth_reg_tab} <ul class="rg_nav"> <li id="js_tab_reg" class="rg_active_nav rg_first_nav"><a href="" onclick="return false;" >Регистрация</a></li> </ul> <span onclick="hidebo();" class="rg_closed"> </span> {#/template js_tmpl_auth_reg_tab} {#template js_tmpl_auth_reg_descr} <strong>Пожалуйста, подтвердите ваш адрес.</strong><br><br>Вам отправлено письмо для подтверждения вашего адреса {$P.register_confirm_mail}.<br>Для подтверждения адреса перейдите по ссылке из этого письма. {#/template js_tmpl_auth_reg_descr} {#template js_tmpl_auth_reg_action} <div class="rg_forms confirm_code_from_letter"> <div class="rg_for_input"> <span class="rg_inp_descr" style="width:15em;">Или введите код из письма:</span> <input type="text" value="" id="confirm_code" name="" data-js_submit="yes" data-js_action="js_confirmFormBut" class="js_keydown_selector rg_input_text_conf" > </div> <div class="rg_for_input"><label>Не пришло письмо? <b>Пожалуйста, проверьте папку Спам</b><br /> (папку для нежелательной почты).</label><br /> <a href="" onclick="ajax_recall_code();return false" >Вышлите мне письмо еще раз!</a></div> <div class="rg_for_input"> <em class="reg_error" id="confirm_msg"></em> <a href="#" class="button button-red" id="js_confirmFormBut">Готово</a> <div class="loading loading-cover" style="display: none;"><div class="loader"></div></div> <br> </div> </div> {#/template js_tmpl_auth_reg_action}