Илья Шальнов Программы для постановки произношения
Господа,
подскажите какую-нибудь программу, которая умела бы делать такую вещь:
подаешь ей аудио-файлы с фразами/предложениями и, возможно, текстом,
после чего она воспроизводит этот аудио-файл,
ты в микрофон повторяешь эту фразу,
а она оценивает, насколько точно ты это сделал.
Не знаю, существуют ли такие программы в природе, и насколько хорошо они работают, но очень хотелось бы с такой поиграться.
[И.Ш.] Во-первых, такой программы не существует. Во-вторых, пользы от такой программы было бы не много.
Почему не существует?
Уже в конце прошлого столетия Майкрософт начала свои эксперименты с технологиями распознания речи. Тогда планы были самыми оптимистичными, но задача оказалась на пару порядков сложнее, чем тогда думалось. А счастье казалось было так близко…
Сейчас программы даже толком распознавать человеческую речь не умеют. Они не могут даже выделить фонемы, что уж там говорить о качестве произношения. Как распознать, где произношение, где манера, где настроение? Где мужской, где женский, где детский голос. Где он устойчивый, где нет. Где хриплый, где звонкий. Всё это программе надо понять, отбросить, выделить фонемы и еще различить, хорошо ли они были произнесены. Пока не реально. Решение этого вопроса было бы делом ценой в миллиарды долларов. Это, конечно, сделают рано или поздно, но едва ли в ближайшие десять лет.
А что сейчас есть?
Есть программа Профессор Хиггинс и программа Rosetta Stone, которые имитируют распознание голоса. То есть, дурят они нашего брата. Написать программу, которая будет «визуально» сопоставлять графики совсем не сложно.
Вывести на чистую воду, к примеру, Розетту Стоун (Розеттский Камень) не трудно. Вы посмотрите, как она оценивает ваше русское произношение. Увидите, что с русским произношением у вас такие же «проблемы», как и с английским. А потом вместо «дым» скажите «кот», но чтобы было похоже, и программа скажет «хорошо».
Почему это бесполезно
Это бесполезно, потому что вы сами должны слышать, и толку от того, что кто-то еще что-то слышит, для вас не много.
И обычно человек слышит лучше, чем говорит, если слушать старается беспристрастно и не старается услышать то, чего пока нет. И, поскольку ты слышишь лучше, чем говоришь, ты всегда знаешь, над чем тебе надо работать.
Что нужно?
Нужна программа, чтобы можно было:
1) Слышать оригинал, и чтобы оригиналом мог стать любой звуковой или видео-файл, с которым интересно работать
2) Читать текст, если он есть
3) Иметь возможность прослушать несколько раз - отмотать назад
4) Записывать себя
5) Слушать себя со стороны
6) Делать всё это, не отвлекаясь на поиск кнопок мышкой
7) Использовать компьютерное растягивание звука
Для этого написана программа ListenRecordSay - комбинация проигрывателя, текстового редактора и диктофона. Ничего нового - только комфорт в работе, а комфорт - это необходимость, а не прихоть. Пока нет юзабилити, пока идут вечные отвлечения от языка к поиску кнопок, никакая реальная сосредоточенность и медитативность не возможна. Да никто и не будет регулярно заниматься с вещами, которые неудобны.
Так что - интересные материалы, собственный слух и эргономика. И будет вам счастье.