Отправляет email-рассылки с помощью сервиса Sendsay

[TC] Ru/En tts автопереключатель.

Привет, многоуважаемая община!

Мой вопрос адресован к людям искушенных в программировании. Но и не
только к ним.

У Linux'овых чтецов (с которыми я знаком) есть такая неплохая
особенность: Они меняют синтезатор в зависимости от того, на каком языке
написан текст. Иначе говоря, текст русский - озвучивает русский синтез.
Текст английский - озвучивает англоговорящий...

Факт No1:
Jaws - имеет заложенную в него, создателями, способность
идентифицировать язык текста (не знаю как насчет экранных подсказок,
таких как язык заголовка, язык контекстного меню и др.).
Факт No2:
Jaws 7-ой версии нажатием hotkay - "Insort+ Ctrl+D" отключает или
включает словарь пользователя.

Можно ли, в принципе, с помощью какой-либо программной примочки, ввиде
патча или еще там чего-нибудь, сделать так чтобы Jaws читал руский текст
- русским голосом с включенном словарем, а английский текст - английским
синтезатором с выключенным словарем?

А возможно нечто подобное уже где-то работает, и ничего не надо выдумывать?

Ответить   Wed, 01 Feb 2006 22:34:46 +1000 (#509080)

 

Ответы:

Здравствуйте, Олег.
Вы пишите:

Это не совсем так.
Распознавать язык возможно только для кодировки Unicode, то есть для версий джоза
выше шестой и сам текст должен быть в этой
кодировке.
Однако большинство текстов у вас в кодировке ASCII, в которой нет такого имманентного
качества, как принадлежность к тому или
иному национальному алфавиту. Все определяется кодовой страницей.
Когда джоз на html страницах сообщает что-нибудь типа russian, то это он определил
наличие атрибута с указанием языка, а не
проанализировал текст на странице и сделал соответствующий вывод.

Вы пишите:

В принципе такое чудо есть. Располагалось оно тут
http://maxreader.narod.ru

Сепарация текста происходит на уровне синтезатора. Для чтения русских слов используется
русский Digalo, для чтения английских -
английский Digalo.
Реализовано это, если вам интересно, путем создания виртуального sapi 4 синтезатора,
который и занимается разбором текста.
С уважением, Анатолий.

Ответить   "i_chay" Wed, 1 Feb 2006 21:51:02 +0400 (#509284)

 

Привет!

i_chay пишет:

джоза

Антон, пожалуйста, давайте только проверенную информацию. Поскольку,
догадки и предположения, ясности не добавляют...

Я включал параметр "Выявлять языки" - и стало явным то, что Jaws 7.0
говорит язык текста, который им читается. Вернее говоря, определяется
лишь русский... На английском - он молчит...
Такой порядок вещей остается неизменным независимо от того, в какой
кодировке написаны буквы и где...
А если еще точнее, unicode - Jaws вообще не выясняет KOI-8R - произносит
"x-cyrillic". SP-1251 - про русский говорит, что он русский, а про
английский, что он тоже русский - в блокноте, и тишина - в Word.

Я знаком с языком разметки, но не где не встречал "атрибут языка". Об
этом атрибуте так же ничего не знает Справочник по HTML:
http://html.manual.ru/book/html.php.

А вот за эту подсказку, спасибо! Только я не думаю, что буду связываться
с Digalo. Ведь было бы на много лучше если можно было бы назначать какой
хочется tts, самостоятельно.

Ответить   Fri, 03 Feb 2006 19:43:51 +1000 (#510339)

 

Здравствуйте, Олег Клинский.
Вы пишите:

догадки и предположения, ясности не добавляют...

Действительно, Олег, давайте проверенную информацию. Меня зовут Анатолий.

Вы пишите:

Я вам объяснил, как это работает. Если вы хотите остаться при своем мнении, то
это - ваше право.

Вы пишите:

Плохо изучали. Смотрите спецификацию w3c -- любой тег html разметки может иметь
атрибут lang.
А кодовая страница для html задается так
<meta http-eqiv="Content-Type" content="text/html; charset=windows-1251">

Соотвествующие атрибуты (но только в своем родном формате) есть и у документов
.doc и, например, .pdf. Если вы будете работать с
серверами OLE (которыми являются и IE и Word, и Acrobat Reader), то без труда
получите от них значения языка текущего документа и
кодовой страницы, что и делает джоз.

Вы пишите:

хочется tts, самостоятельно.

Флаг в руки. Возьмите документацию по sapi 4 или 5 и создайте то, что вам хочется.
С уважением, Анатолий.

Ответить   "i_chay" Sat, 4 Feb 2006 09:50:43 +0400 (#510684)