Отправляет email-рассылки с помощью сервиса Sendsay

[TC] Распознавание DJVU Файлов

Почтеннейшая публика! Я к вам еще за одним советом. Тут прослышал я, будто можно
файлы DJVU распознавать, не переконвертируя их прежде в PDF, в необходимости
чего я был ранее уверен. И еще поведали мне, что эти самые DJVU файлы бывают
с распознанным текстом. Так может быть, кто подскажет, какими средствами можно
распознавать DJVU файлы, а то без знания этого совсем пропадаю. С глубоким почтением
и надеждой на ответ, Денис, Г. Харьков.

Ответить   Mon, 17 Dec 2007 14:44:39 +0200 (#711342)

 

Ответы:

Здравствуйте, Denis.

Вы писали 17 декабря 2007 г., 15:44:39:

Вовсе необязательно. Достаточно просто распотрошить их на графические
файлы, по файлу на страницу, а затем сунуть в файнридер.

Бывают.

Ответить   Mon, 17 Dec 2007 16:43:48 +0300 (#711366)

 

Здравствуйте, Denis.

Вы писали понедельник 17 декабря 2007 г. 15:44

Насколько мне известно, fine reader не поддерживает формат djvu никаким образом.
Что же касается распознавания, то для русского языка пока что ничего нет. Попался
мне как-то распознанный текст из djvu - кто бы знал, какая это была лажа! Так
что, единственный способ для незрячего получить доступ к книге, отсканированной
в формат djvu - это конвертация в один из поддерживаемых fine reader графических
форматов (tif, bmp, pdf...). В tif или bmp можно сконвертировать, например, с
помощью утилиты djvudecode (искалась на ура в любом поисковике). Ну и потом,
само собой, распознавание.

P.S. Кстати, экспериментальным путём было установлено, что обсуждаемая в данный
момент альтернатива fine reader'у программа CuneiForm, поддерживает ещё меньше,
нежели fine reader форматов, кроме djvu неподдерживаются также gif и pdf. Общими
впечатлениями поделюсь немного позже, когда как следует потестирую её.

Ответить   Mon, 17 Dec 2007 18:35:39 +0300 (#711402)

 

Здравствуйте, Denis.

Попробуйте: 1.irfan view;2.djvu view; 3.djvu sollo-может поможет.
Ксожалению прямых ссылок не дам, пользовал давно эти проги.

Ответить   Tue, 18 Dec 2007 12:36:16 +1000 (#711628)