Отправляет email-рассылки с помощью сервиса Sendsay

[TC] создание синтезатора речи

Всем привет!
некоторые политики нашли понимание в необходимости создания кыргызского синтезатора
речи. Они
интересуются, сколь будет стоить создание синта. Я считаю, что нужно делать кыргызский
синтезатор
речи, работающий на сапи-5 движке.
мне нужна от вас следующая помощь:
какие компании (с указанием сайта или контактов) занимаются разработкой синтезаторов
речи в РФ?
какие компании (аналогично вышеуказанному) занимаются разработкой синтезов в
США и других странах.
еще такой вопрос:
возможно ли на основе русского синтезатора речи сделать кыргызский синтезатор
речи? дело в трех
буквах, коих нет в русском языке.
Создание подобного синтезатора будет оплачиваться, но для начала надо определиться
со стоимостью.
были некоторые подвижки с bookmania, но к сожалению он не все тексты воспринимает
и оказался
бесполезным....
Мне писали о возможности создания такого синта, но на этом все застопорилось
((. Была компания в РФ,
которая и вовсе загнула баснословную сумму в размере 1 млн. долларов США )).
Как-то получилось у Андрея Поликанина озвучить кыргызские буквы коммерческой
мышью, скоро собираюсь
ее покупать и попробовать на кыргызских текстах.
просьба, помочь всем по возможности.
Актуальность в создании кыргызского синтезатора обусловлена тем, что не выпускается
литература на
кыргызском языке, нет доступа у незрячих к информации на кыргызском языке, мало
аудиокниг на
кыргызском языке.
всем спасибо!

С уважением, Дастан Бекешев
www.disability.kg
twitter: bekeshev

Ответить   das Sat, 27 Nov 2010 15:27:12 +0500 (#1307786)

 

Ответы:

доброго часа, das.
попробуйте пообщаться с этими польскими товарищами:
http://ivona.pl
может они помогут и не заломят такую цену. точно могу сказать, что
если они сделают синт, то сделают его на совесть.
можно ещё в сакрамент написать, но у них придурнючие синты.
вообще же, можно попробовать решить данную траблу, создав словарик для
нвда для голоса, по вашему мнению более или мение корректно читающего
текст на кыргызском языке. если это интересно, позвоните в скайп,
расскажу вам что и как.

хорошего дня das (rasylka-info@y*****.ru).
с пожеланиями удачи вам и всем читающим, александр, россия, москва.
http://airosunrise.listen.moeradio.ru:10000/airosunrise.m3u
volnove***@y*****.ru
twitter: dolbozavr , skype- energi15

Ответить   Sat, 27 Nov 2010 14:14:19 +0300 (#1307937)

 

Здравствуйте.

Центр Речевых технологий: http://www.speechpro.ru
Ну ещё несколько Беларуских:
http://sakrament.com
http://speetech.by
http://uiip.bas-net.by/rus/l_rsr_project_4.html

Ну их много, например:
http://www.acapela-group.com
http://www.cepstral.com
http://www.ivona.com
http://www.loquendo.com
http://www.neospeech.com
http://www.svox.com
http://www.nuance.com
И это, разумеется, ещё не все, так как всех я наверное и не знаю.

Если все звуки более менее можно описать русскими буквами, то наверное
можно. Например, в Капитане и Мыше именно так и реализована поддержка
украинского и белорусского языков - просто на основе схожих фонем.
Попробуйте связаться с Анатолием Николаевичем Камыниным, который и
занимается сейчас разработкой Капитана (координаты см. на tiflocomp.ru).

Да, думаю, это вполне реально уже сейчас.
В коммерческой Мыше в конфигурационном файле есть секция [Unicode]. В ней
можно задать чтение юникодовских буквенных символов посредством прописывания
их произношения символами кириллицы. Это выглядит примерно так:
U+00FC=ю|уумлаут
Здесь сначала написан шестнадцатеричный код символа, далее прописано его
произношение в рамках слова, то есть непосредственно обозначаемая фонема, а
потом прописано его название для одиночного произношения, например, для
посимвольного чтения.
Возможно уже этого будет достаточно для базовой поддержки кыргызского языка.
Только вот MyMouse - это не SAPI5.

Ну ещё можно посоветовать вариант с созданием кыргызскоязычного голоса в
рамках проектов eSpeak (http://espeak.sourceforge.net) или Festival
(http://www.cstr.ed.ac.uk/projects/festival/). Это open source проекты, так
что финансовых затрат даже не потребуют. К тому же eSpeak вообще уже запилин
под SAPI5 плюс имеет специальный редактор для создания новых языков.

Ответить   Sat, 27 Nov 2010 14:28:45 +0300 (#1307958)

 

Здравствуйте , Walked!

Вы писали:

Напишите пожалуйста, какие еще синтезаторы поддерживают эту возможность?
Имеется ли она в тифлокомповской сборке "Капитана"?

Ответить   Sat, 27 Nov 2010 19:04:19 +0600 (#1308068)

 

Vande omentaina, Владислав Демьянов!

Да, верно, только не |, а ; :-).
Сколь я знаю, другие синтезаторы такого не поддерживают. Я таким
образом ввёл в свой файлик несколько языков (помимо тех, что уже были
в релизе - удмуртский, кыргызский, шведский). Но это опять же
приблизительное чтение.

Ответить   Sat, 27 Nov 2010 15:07:38 +0200 (#1308071)

 

Здравствуйте , Menelion!

Вы писали:

А в какой синтезатор можно внести фонемы специфических звуков, чтобы не
пришлось его сильно ковырять? В L&H3000 russion пытался внести
специфические фонемы, но так и не смог разобраться, как это сделать.

Ответить   Sat, 27 Nov 2010 19:19:14 +0600 (#1308078)

 

Vande omentaina, Владислав Демьянов!

Пойми, что это не фонемная обработка, к сожалению. Например, немецкое
"о умлаут" (сам символ Subscribe.ru не пропустит) это далеко не "ё",
но я заменил его на "ё" внутри слова, чтобы банально при беглом
просмотре мышью отличать его от простого "о".

Ответить   Sat, 27 Nov 2010 15:21:55 +0200 (#1308083)

 

Здравствуйте.

По большому счёту это фишка только коммерческой Мыши. Многие её ругают, в то
время, как помимо голоса как такового, там есть ещё куча уникальных вещей,
которых больше нигде нет.
Что же касается Капитана с Тифлокомпа, то там как раз можно попытаться
сделать что-то подобное. Но будет это немного по-другому.
Можно попытаться внести определённые добавления в файл ru_lat.conf (для
русского голоса) или в uk_lat.conf (для украинского). При стандартной
установке они лежат по пути: C:\Program Files\Tiflocomp Software\TCTts\data
В секцию [Letters] надо прописать одиночное чтение символа по аналогии с уже
имеющимися записями, то есть буква - пробел - знак равенства - пробел -
произношение кириллицей, а в секцию [Replacements] в аналогичном формате
прописать чтение этих же букв в потоке. Формат файла UTF-8, так что с
unicode'ом проблем быть не должно.
На практике я это не реализовывал, но теоретически это должно работать.
Точнее возможно расскажет сам Анатолий.

Ответить   Sat, 27 Nov 2010 17:59:22 +0300 (#1308165)

 

Здравствуйте , Walked!

Вы писали:

К сожалению не работает

Ответить   Sun, 28 Nov 2010 10:34:03 +0600 (#1308729)

 

Здравствуйте, Walked.
Вы писали 27 ноября 2010 г., 16:28:45:

русскими буквами? не знаю. одна буква подобная букве "Н" звучит как сочитание
английских букв ng в
словах moorning, evening и т.п. Другая буква похожа на "О", но она между о и
ё, короче не напишешь,
надо озвучивать )). Ну и третья буква что-то между звуками букв "У" и "Ю".
в windows в раскладке клавиатуры имеется переключение на кыргызский язык, все
русские буквы
сохраняются, 3 дополнительные буквы набираются при помощи нажатия и удержания
левого альта и
соответствующих русских букв "Н", "О" и "У".
правда, при переходе на кыргызский язык, наблюдаются глюки с горячими клавишами
в других программах,
поэтому рекомендую после эксперимента удалить эту раскладку.
черт, уверен, что подобные звуки имеются и в других языках мира, и даже в тех,
на которых имеются
синты...
К сожалению, Анатолий Камынин не сможет заняться кыргызским синтом по некоторым
обстоятельствам, а
так он бы справился, почему-то в этом уверен!

С уважением, Дастан Бекешев
www.disability.kg
twitter: bekeshev

Ответить   das Sun, 28 Nov 2010 15:50:28 +0500 (#1308958)

 

Здравствуйте.

Могу лишь ещё раз отправить вас в сторону eSpeak и его редактора голосов -
eSpeak Edit. Уверен, что там это можно реализовать, разумеется, с учётом
определённой скидки на общие недостатки качества речи этого синтезатора. К
сожалению, я не знаю кыргызского, а так бы с радостью помог бы практически.

Ответить   Sun, 28 Nov 2010 13:33:16 +0300 (#1308986)

 

доброго часа, Walked past.
я особенно не разбирался, а как там с джозабильностью? как создать
новый язык, хотя бы основу? просто в хелпе у меня пока нету времени
разобраться, а знать, хотя бы немножко, хочется.

хорошего дня Walked past (walked_pa***@r*****.ru).
с пожеланиями удачи вам и всем читающим, александр, россия, москва.
http://airosunrise.listen.moeradio.ru:10000/airosunrise.m3u
volnove***@y*****.ru
twitter: dolbozavr , skype- energi15

Ответить   Sun, 28 Nov 2010 16:32:57 +0300 (#1309106)

 

Всех приветсвую!
Интересная тема! Народ а у турков есть свой синт?
Для Кыргызского языка можно было бы взять за основу уйкурский синт или
Хакасский!
Понимаю,что хакасский утопия,а вот уйгурский может и будет.

Ответить   Георгий Sun, 28 Nov 2010 19:23:43 +0300 (#1309298)

 

Vande omentaina, Георгий!

У турок свой синтезатор есть, причём не один (есть даже RSD-голос).
Кроме него есть синтезаторы от Acapela, Loquendo и ещё каких-то
ведущих фирм. Насчёт уйгурского не знаю, а вот хакасского, почти
уверен, не существует.

Ответить   Mon, 29 Nov 2010 16:02:19 +0200 (#1310684)

 

Здравствуйте, Walked.
Вы писали 28 ноября 2010 г., 15:33:16:

тут вопрос качества голоса пока не стоит, пока как-нибудь озвучить кыргызские
буквы.

С уважением, Дастан Бекешев
www.disability.kg
twitter: bekeshev

Ответить   das Wed, 1 Dec 2010 21:03:24 +0500 (#1314075)

 

Здравствуйте, das.

Вы писали 28 ноября 2010 г., 13:50:28:

и

пробуйте в акапеловской Алене в словарик внести эти буквы, может
понравится, хотя в случае с украинским языком одного только внесения
букв недостаточно, надо вносить и много слов.

Ответить   Sun, 28 Nov 2010 19:44:34 +0300 (#1309314)

 

Здравствуйте , Oksana!

Вы писали:

К сожалению эти буквы в лексиконе отображаются вопросительными знаками,
поэтому их так не озвучишь. Может можно попробовать в ручную
отредактировать файл словаря?

Ответить   Mon, 29 Nov 2010 01:45:43 +0600 (#1309502)

 

Здравствуйте, Владислав.

Вы писали 28 ноября 2010 г., 22:45:43:

так я же об этом и говорю, добавить в в словарь. вот например говорили
что буква похожа на звук в английском morning
этот звук отображается в словаре вот так
No n k

Ответить   Sun, 28 Nov 2010 23:19:11 +0300 (#1312272)

 

Здравствуйте , Oksana!

Вы писали:

Согласен, но в поле что читать, эти буквы отображаются вот так "?".
Поэтому после внесения такой замены все непонятные Алене буквы будут
читаться, точно также, как и вопросительный знак.
Поэтому я и спрашивал, можно ли без лексикона внести запись в файл
словаря Аленки в ручную. Простите, что не смог сначала правильно
сформулировать вопрос.

Ответить   Wed, 01 Dec 2010 09:44:02 +0600 (#1312883)

 

Здравствуйте, Oksana.
Вы писали 28 ноября 2010 г., 21:44:34:

Алёна их просто не воспринимает.

С уважением, Дастан Бекешев
www.disability.kg
twitter: bekeshev

Ответить   das Wed, 1 Dec 2010 21:01:36 +0500 (#1314073)

 

Здравствуйте!
Есть турецкий синтезатор RealSpeak Solo Direct Aylin. Может быть стоит
обратить на него внимание? Ведь турецкий и кыргызский родственные языки.
Могут быть не мало общих звуков и слов.
С уважением Ашир.

Ответить   Mon, 29 Nov 2010 19:40:34 +0300 (#1310748)

 

Здравствуйте, ashir1970.
Вы писали 29 ноября 2010
г., 21:40:34:
> Есть турецкий синтезатор
RealSpeak Solo Direct Aylin.

тут также как и с Татарским, надо испрашать лингвистов. а где можно скачать турецкий
синт?

С уважением, Дастан Бекешев
www.disability.kg
twitter: bekeshev

Ответить   das Wed, 1 Dec 2010 21:05:22 +0500 (#1314080)

 

Здравствуйте, Дастан Бекешов!
Турецкий синтезатор можно скачать на сайте freedom scientific down loads
С уважением Ашир.

Ответить   Thu, 2 Dec 2010 06:22:06 +0300 (#1314728)

 

Vande omentaina, ashir1970!

Прямая ссылка:
ftp://ftp.freedomscientific.com/users/hj/private/WebFiles/RSD/1.0/RSD1.0.84.101-trt-Aylin-enu.exe

Ответить   Thu, 2 Dec 2010 14:29:43 +0200 (#1315497)

 

Приветствую всех.

Мы уже обсуждали с Дастаном вариант с адаптацией Капитана. Скажу лишь о технической
стороне вопроса (к тому же она касается и варианта с espeak).
1. Необходимо составить или найти в соответствующей литературе правила преобразования
букв в фонемы для кыргизского языка (наилучший вариант, конечно, для кириллицы,
латиницы и арабского алфавита, но минимум -- для кириллицы). Скорее всего, такая
информация есть в Кыргизском национальном университете, но его интернет-ресурс
я найти не смог.
В Капитане правила преобразования реализованы жестко в коде самого синтезатора.
В espeak правила преобразования букв в фонемы описываются в простом текстовом
файле, который затем компилируется в более удобную для обработки форму (т.е.
здесь даже программист не нужен):
http://espeak.sourceforge.net/dictionary.html

2. На мой взгляд, адаптировать русскоязычные синтезаторы для других языков --
это не самый лучший способ и его надо, если возможно, всячески избегать. Опять
же, на мой взгляд, надо сразу настраивать всех на то, что нет другого варианта,
как создание полноценного синтезатора со своей собственной базой.
Если же все-таки придется использовать базу Капитана или eSpeak, то надо начитать
слова с недостающими фонемами в разных позициях (в соответствии с правилами из
п.1), а потом вырезать соответствующие фрагменты из звуковых файлов. В espeak
можно добавлять и аллофоны, и форманты (если описанный при помощи формант звук
получается достаточно качественным).
Для Капитана здесь проблема лишь в том, чтобы тембр добавляемых аллофонов не
сильно отличался от тембра уже присутствующих в базе.

Разумеется, это минимум, что надо сделать, так как остается еще интонация, словарь
ударений и т.п.

Успехов. Анатолий.

Ответить   "i_chay" Sun, 28 Nov 2010 16:20:32 +0300 (#1309098)

 

Здравствуйте.

Как я понимаю, киргизский язык достаточно близок к татарскому: те же семья,
ветвь и группа, различаются только подгруппы. По крайней мере, совпадение
лучше, чем с русским.
В принципе существует готовая дифонная база татарского синтезатора с
документацией, подготовленная в своё время Казанским Гос.Университетом.
Возможно можно попытаться адаптировать эту наработку под киргизский язык.

Ответить   Sun, 28 Nov 2010 16:50:59 +0300 (#1309119)

 

Здравствуйте, Walked.
Вы писали 28 ноября 2010 г., 18:50:59:

к сожалению, я не знаю как звучит Татарский язык. А где можно взять дифонную
базу с документацией?
и тут вопрос к лингвистам, сильно ли отличаются кыргызский язык от татарского.
на мой взгляд,
сильно...

С уважением, Дастан Бекешев
www.disability.kg
twitter: bekeshev

Ответить   das Wed, 1 Dec 2010 21:00:54 +0500 (#1314072)

 

Здравствуйте.

Можете послушать, например, здесь:
http://www.youtube.com/watch?v=AsKPlyV8zKY

http://www.ksu.ru/eng/departments/ktk/sintez/

Ответить   Wed, 1 Dec 2010 20:21:34 +0300 (#1314271)

 

всем привет и вам das.
насчёт татарских звуков,
татарский язык в данный момент основывается на кириллице.
к 33-ём буквам добавлены ещё 6 букв.
это мягкая "у" о не й вы,кажется, говорили,
далее мягкая "а",
затем сжатая "э",
и 3 согласных
мягкая "ж",
мягкая "х"
и гортанно-носовая "н".
я не в теме, но по-моему, у кыргызского языка теже звуки.
но татарского синтеза я чот не слышал,если бы он был, я бы хотел его
попробовать,
даже раскладку бы установил татарскую.
хотя она меня бесила,
нначинаешь писать,
вроде, по-русски пишешь,
потом в середине предложения натыкаешься на татарские символы.
ну,и, матерясь,
переключаешь раскладку.
с уважением евгений

Ответить   Fri, 3 Dec 2010 00:49:10 +0300 (#1316072)

 

Здравствуйте, i_chay.
Вы писали 28 ноября 2010 г., 18:20:32:

был бы исполнитель, было бы супер! к сожалению, я не имею технического образования
чтобы реализовать
описанное. да и работа такая, что только смогу протестировать, заказать, заплатить
и работать на
синте.
проблема щас в определении стоимости синта, ибо стоимостью интересуются все:
простые политики и
президент страны.
определив примерную стоимость синта, можно придти к решению создания синта.

Ответить   das Wed, 1 Dec 2010 20:58:37 +0500 (#1314067)

 

Здравствуйте,Дастан Бекешев!
Y возможно ли на основе русского синтезатора речи сделать кыргызский
синтезатор
речи? Y

Ой сомневаюсь я,тюркская фонетика всё ж отличается от славянской!

Ответить   Георгий Sat, 27 Nov 2010 23:44:03 +0300 (#1308514)