Отправляет email-рассылки с помощью сервиса Sendsay
  Все выпуски  

OFF-Line журналы от Sergik'a #57


OFF-Line от Sergik'a


Разделы сайта:
  Главная

Журналы
Хакер
Страна Игр
E-Football
WebDix
Компьютерра
ПроКино
PerCom
SoftHome

Старые
Спец.Хакер
FC Games

Заработать WM
Оставить отзыв
Партнеры


  Новости:
На сайт добавлены журналы:
Компьютерра №03 (Январь)
ПроКино №7 (Февраль)
Страна Игр №245 (Октябрь)
Страна Игр №244 (Октябрь)
Страна Игр №243 (Сентябрь)
Страна Игр №242 (Сентябрь)
Страна Игр №241 (Август)


  Читателей: 1 623.

В сегодняшнем 57-ом выпуске ...

Создан первый аудиопоисковик

     Разработанный «Центром речевых технологий» Voice Digger — первый отечественный поиск по ключевым словам в звукозаписях русской речи. Voice Digger позволяет автоматически выделять ключевые слова и словосочетания в потоке слитной речи без предварительного прослушивания. Разработка основана на непрерывном распознавании речи, реализуемом с использованием теории скрытых марковских процессов (НММ). Ключевые слова задаются в виде обычного текста, по которому система строит НММ-модель каждого слова. На выходе VoiceDigger предоставляет ссылку на звуковой документ и местоположение искомого слова или словосочетания.
     Специалист по компьютерной лингвистике Виктор Бочаров рассказал, что качество системы поиска ключевых слов определяется двумя показателями: вероятностью обнаружения ключевого слова и вероятностью ложного срабатывания при заданной длине искомого слова. Обычно пользователь может регулировать чувствительность системы в зависимости от того, что для него хуже: пропустить произнесение слова или получить много ложных срабатываний. В «Центре речевых технологий» сообщили, что уровень ошибки системы составляет порядка 8%.
     Участники рынка сулят новой разработке серьезные перспективы. Андрей Терехов, генеральный директор «Ланит-теркома» говорит: «Если новая разработка действительно позволяет распознавать около 90% процентов речевого потока, который записан без особых стараний со стороны говорящего, без „вычеканивания“ каждого слова, то, безусловно, эту технологию можно назвать прорывом в области audio data mining». Согласен с ним и Виктор Бочаров. Он уверен, что у данной технологии хорошие перспективы, так как появляется возможность производить поиск по большому количеству информации, существующему только в звуковой форме. «Я думаю, что интеграция этой функции в поисковые системы будет пользоваться успехом у пользователей», — полагает лингвист.
     В ЦРТ считают, что новая технология будет пользоваться спросом в крупных системах обработки, хранения и анализа данных. Модули, созданные на базе Voice Digger, позволят оперативно обработать не только текстовые, но и мультимедиа-данные и получить на выходе систематизированные выборки по интересующей пользователя тематике.
     В качестве примера аналогичной западной разработки можно привести компанию TVEyes. Фирма создала поиск по содержимому аудио- и видеопотоков. TVEyes предоставляет своим клиентам возможность производить поиск по ключевым словам среди содержимого ведущих телеканалов и радиостанций США, Канады, Великобритании и Австралии. Для отдельного пользователя пользование услугами TVEyes в зависимости от предоставляемых возможностей составляет от $0 до $5000 в месяц.
     Огромное количество аудио- и видеофайлов, выложенное в интернете, даёт большое поле для расширения сферы поиска традиционных поисковиков. Ранее Google сообщал о том, что в 2006 г. будет запущен интернет-поиск по содержимому аудиофайлов, но этого пока не произошло. В «Яндексе» отмечают, что в силу ограниченности вычислительных мощностей время для этого еще не пришло. «Количество аудиофайлов в Рунете исчисляется миллионами, и заранее не известно, является ли файл музыкой или речью, на русском или английском. Качество распознавания и скорость обработки могут стать препятствием для индексации больших массивов речевой информации», — считает Александр Садовский, руководитель отдела веб-поиска «Яндекса».
     Тем не менее, генеральный директор «Центра речевых технологий» Михаил Хитров уверен, что у разработки его компании есть большие перспективы: «В связи со все более активным использованием естественного интерфейса и, в частности, голоса для общения с техникой возросло и значение аудиозаписи как единицы носителя информации. Появилась потребность в системах, способных быстро и эффективно обслуживать аудио-архивы и находить нужную информацию в большом объеме записи».

Источник: сnews.ru

-----------------------------------------------------
Мой сайт по-прежнему находится по адресу www.sergikhack.narod.ru
-----------------------------------------------------

До встречи на этих страницах!

В избранное