Отправляет email-рассылки с помощью сервиса Sendsay
  Все выпуски  

Новости поисковых систем от Searchengines.ru


Форум
Биржа ссылок
Магазин

Новости

Блог

Пресс-релизы

Статьи

Календарь событий

Компании

Люди

Сегодня в новостях:

Google опубликовал финансовые результаты Q2

20.07.2012


Google Inc. анонсировала финансовые результаты Q2 2012. Прибыль второго квартала, исключая затраты на приобретение трафика размером $2.6 миллиарда и увеличение оборота за счёт приобретения Motorola Mobility, составила $8.

DirectEditor: десктопное приложение для управления Яндекс.Директом

20.07.2012

DirectEditor - новый независимый декстопный центр управления рекламой Яндекс.Директ

Google Ventures инвестирует в сервис Pocket

20.07.2012


Сервис «заметок на будущее» Pocket анонсировал второй раунд инвестирования, в ходе которого планируется привлечь вложения в размере $5M. Среди инвесторов, которые примут участие в туре — Foundation Capital, Baseline Ventures

4SMO: ControlStyle представляет сервис продвижения в Твиттере

20.07.2012

Система ищет тематические твиты и отвечает на них или предлагает ответить пользователю.

Yahoo подарила Мариссе Мейер первый подарок

20.07.2012

Спустя день после анонсирования новой должности, Марисса Мейер (Marissa Mayer) получила первый подарок от своего нового работодателя. Как Марисса написала в своем Твиттере, в октябре она ожидает ребенка; компания Yahoo

Алексей Байтин: Поиск и машинный перевод

Почему вообще машинный перевод и поиск оказались связанными? Часто задают вопрос: «А как вообще люди зарабатывают машинным переводом?». Достаточно взглянуть на дневную статистику Яндекса, и все сразу становится понятно. Десять миллионов запросов в день задаются на английском языке, среди показанных документов – около 30 миллионов документов на английском, поэтому очень часто люди в поиске набирают запросы, связанные с переводом.

Алексей предложил слушателям заглянуть просто в поисковые подсказки, где можно увидеть, что переводчик онлайн на букву «П» стоит на первом месте, обгоняя даже погоду. Понятно, что у пользовательской аудитории есть некий интерес к переводу вообще. Докладчик не стал демонстрировать статистику по онлайн- переводчику с русского на английский, или с русского на итальянский, потому что и без этого всем ясно, что основная масса – это англо-русские переводы.

Яндексу только оставалось решить, что и как начать переводить. Выбор, как переводить - очень простой, либо с использованием синтаксических правил, либо статистического машинного перевода. Яндекс сделал свой выбор в пользу статистического машинного перевода.

Вопрос о том, что переводить, оказался более сложным. Можно попытаться переводить тексты целиком, найти в интернете целиком все книги, все статьи, все сайты и пытаться их показывать в переводе. Но, понятно, что это никого не устроит, потому что сайты появляются быстрее, чем Яндекс будет успевать их переводить. Не успеешь оглянуться, как люди будут писать письма уже совершенно в других формулировках. Поэтому это решение не годится.

По словам докладчика, можно долго рассуждать, как будет лучше для перевода. Можно решить, что переводить нужно предложениями. Но, опять-таки, предложений тоже невозможно набрать очень много, как невозможно предусмотреть появление новых, созданных по другим правилам… Можно попытаться дробить предложения на фразы, даже иногда на слова, для достижения большей точности и удовлетворительности перевода.

Задача идеального перевода - практические не решаема, Яндекс отдает себе в этом отчет, и заранее готов к тому, что его перевод будет содержать изрядное количество комических дефектов и до литературного перевода, может быть, не дотянет никогда.

Далее Алексей наглядно продемонстрировал слушателям трудности перевода на примере разбора нескольких предложений.

Читать дальше


В избранное