Отправляет email-рассылки с помощью сервиса Sendsay

[ksoft] Автоматический переводчик GOOGLE поумнеет благодаря ООН

Привет, All!

На проводившейся компанией Google в конце мая конференции Google
Factory Tour (http://www.google.com/press/factorytour.html
веб-трансляция доступна здесь) инженеры компании
представили промежуточные результаты работы над новой версией системы
машинного перевода Google Machine Translation Systems.

Как http://blog.outer-court.com/archive/2005-05-22-n83.html
рассказывают очевидцы, уже сейчас результаты можно
назвать куда более убедительными, нежели
http://www.google.com/language_tools у текущей версии.

Это, в сущности, и неудивительно: систему "натаскивают" с помощью
многоязычной документации из архивов ООН, и объём обработанной
информации тождественен уже 200 миллиардам слов. При этом принцип
"натаскивания" - самый простой. Это принцип "Розеттского камня", -
обнаруженного в Египте и позволившего расшифровать древнеегипетскую
иероглифическую письменность (один и тот же текст там был записан
греческими буквами, египетским демотическим письмом и иероглифами).

Таким образом, система, проанализировав два параллельных текста на
разных языках, формирует языковую модель. Для того, чтобы она была
эффективной, необходимо, чтобы объём анализируемого текста был как
можно более массивным, чтобы система не сталкивалась с незнакомыми и
непонятными оборотами и фразеологизмами, которые не сможет адекватно
перевести.

Ответить   NetVamp Thu, 2 Jun 2005 10:23:13 +0300 (#378085)