[TC] Re[3]: Расспознавание формул
Здравствуйте, galiahmet***@r*****.ru.
> Но просто очень напрягает то, что нет возможности нормально прочитать
> формулу когда захочешь.
А как в вашем понимании должно выглядеть "нормальное" чтение формулы слепым
на компьютере?
TeX-нотация - это вообще-то ещё тот костыль как средство чтения. Зрячие
TeX-нотацию не читают, а только редактируют. Это просто слепым приходится
читать это в таком виде, но это не от хорошей жизни, а за неимением
возможности прочитать графический результат компиляции.
Тот же MathML читается лучше.
> Вообще сейчас я задумываюсь не взять ли эту тему на диплом.
Ну диплом, в значительной степени, - это научное исследование, так что брать
можно совершенно разные задачи, и эта ничуть не хуже других.
> Но возникает вопрос даже если сделать само распознование этих формул,
> нужно
> дальше либо делать так чтобы оно и обычный алфавит распознавало либо
> как-то
> куда-то встраивать в "word" чтоли или"fine reader".
Самый очевидный вариант - это публикация в виде библиотеки где-нибудь на
GitHub. Если хотите, потом могу помочь с популяризацией.
Далее уже на её основе можно делать многое, например, плагины для программ
экранного доступа, где можно указать примерную область страницы, которую
библиотека и будет распознавать: подвёл курсор, нажал, распознал и прочитал.
А главное делать это уже смогут все желающие.
> Так что терзаюсь смутными сомнениями и пытаюсь выяснить не реализованно ли
> это где-нибудь.
Поскольку в промышленном масштабе это мало кому нужно, то в рамках какого-то
большого продукта реализации мне не известно. Есть разные инициативы, так
или иначе сосредоточенные вокруг слепых, где пытаются что-то сделать,
например, http://www.inftyproject.org/en/index.html
Фактически распознать математический текст не так уж и сложно. Есть ряд
популярных источников графических изображений, из которых собираются формулы
для последующей печати. Главным образом, это LaTeX и MS Equation. Какого-то
безумного обилия шрифтов тут, как правило, нет, так что научиться
распознавать из картинки элементы можно без сверхчеловеческих усилий.
Весь вопрос в том, в каком именно виде вы потом хотите это представлять.
Если в TeX-нотации, то надо писать довольно сложный алгоритм обратной
конвертации. Если что-то другое, то там тоже речь о каком-то алгоритме
преобразования, типа интеллектуального чтения значка логарифма в текстовую
строку "логарифм числа 16 по основанию 2", которую потом зачитывать
синтезатором речи.
В общем сама проблема доступности математического текста не столько в
оптическом распознавании значков, сколько в форме удобного представления их
для слепого, а это уже во многом творческая задача.
Успехов. Никита.